AlphaGo的技术能够有广泛的用途,但是将它的应用搬离游戏范畴仍是一个挑战。
在人类顶级棋手之一被打败之后,这项古老的围棋游戏已经成为计算机想要征服人类的目标之一。在首尔为期六天的比赛中,在全世界上亿人的关注下,由谷歌旗下的公司DeepMind开发的计算机算法AlphaGo以4:1的成绩打败了围棋专业棋手李世石。这项古老的棋类游戏的复杂性和直观性使其成为人工智能领域最大的挑战之一。现在最大的问题是DeepMind公司下一步打算做什么。
AlphaGo的通用方法——除了专门为该游戏设计添加的元素外——可以应用到涉及图像识别,决策和计划等领域的许多问题。但是这种方法也很有限。“它令人印象很深刻,但是同时,仍有很大的挑战,” 加拿大蒙特利尔大学的计算机科学家Yoshua Bengio说。
曾预言他将赢得与谷歌的比赛的李世石也为他的失败感到震惊。在十月份,AlphaGo打败了欧洲的冠军樊麾。但打败李世石的程序版本已经比之前强大多了,埃德蒙顿阿尔伯塔大学的计算机科学家Jonathan Schaeffer说,他的软件Chinook曾在2007年写过:“我期待他们用使用更多的计算资源,进行更多的学习,但我却仍然不想看到这么令人惊奇的结果。”
它提高的主要原因在于AlphaGo下棋的次数越多,它就会变得更强,美国亚利桑那州立大学研究人工智能发展趋势的社会科学家Miles Brundage说。AlphaGo使用了基于大脑结构设计的神经网络,其中模拟神经元的各层之间的联系在经验的基础上不断加强。它先学习了3千万场人类围棋比赛的棋谱,然后在与自己一次又一次的对弈中不断提高,这是一种叫加强学习的技术。接着,DeepMind公司把AlphaGo识别胜局状态的能力和一种“前瞻搜索”的技术结合起来,该技术搜索各种落子的位置可能导致的结果来决定选择哪一种落子方案。
接下来,DeepMind可能会进军更多的游戏。玩家能够获得所有信息的大部分的棋类游戏现在已经都被解决了。但机器仍然不能在多人扑克游戏中打败人类,也就是每个玩家只能看到自己的牌的扑克游戏中。DeepMind团队已经对一款科幻小说题材的策略游戏Starcraft表示出了极大的兴趣,而Schaeffer表示DeepMind可以设计一款程序来学习玩各种不同的游戏。这样的程序已经在年度国际通用游戏大赛上完成了,该比赛是为了促进更一般类型的人工智能的创造。Schaeffer相信DeepMind将会在比赛中脱颖而出。“很明显,我能肯定人们会仰视它的存在,”他说。
DeepMind的创始人兼首席执行官Demis Hassabis在上个月的一次会议上提到,训练出一款省略从人类围棋高手中学习的部分,只进行自我对弈学习版本AlphaGo的可能性。该公司在2015年用这种方式完成了一个学会玩不太复杂的街机游戏的程序。不以对人类大脑的学习为开始,AlphaGo可能要花上多得多的时间来进行学习,Bengio 说——并且可能永远也无法打败人类的冠军。但这是很重要的一步,他说,因为人类就是在这样很少的引导下学习的。
位于伦敦的Deepmind公司计划涉足游戏之外的领域。在二月该公司建立了DeepMind Health,并且与英国国民健康服务机构合作:它的算法能最终应用诊所的数据来提高诊断或治疗方案。这样的应用面临的挑战和游戏完全不同,华盛顿州西雅图的非营利组织艾伦人工智能研究所的首席执行官Oren Etzioni说。“最普遍的问题就是在游戏中你可以收集无数的数据,”他说——并且程序能够在许多局游戏中不断得到反馈从而知道哪些是好的落子,哪些是坏的。但是在杂乱无章的现实世界中,数据——比如关于稀有疾病的数据——可能非常罕见,甚至对于普通疾病,想判断出结果的好坏可能也并不是那么直接。
Hassabis说过DeepMind的算法能让智能手机的个人助手更加正确地理解用户的要求。人工智能的研究人员发现了人类对话与游戏之间的相似之处:“每个人都在制作一场游戏,而我们有轮流的顺序,并且每个人都有自己的目标,” Bengio说。但他们也提到机器在语言和人类的交互方面还涉及到很多不确定性。
DeepMind的背后有一个强大的自由学术团队在推波助澜,并且在谷歌支持下,有着大量的员工和计算资源,蒙特利尔麦吉尔大学的计算机科学家Joelle Pineau说。它在围棋上的巨大成就引起了大量关于什么时候人工智能会拥有通用的一般性智能的讨论。“人们因为这件事突然会说,如果人工智能能打败世界冠军它就能做任何事情,” Etzioni说。但深度强化学习仍然只适用于某些领域,他说:“我们离一般性的人工智能还有很长很长的路要走。”
DeepMind的方法并不是唯一推动人工智能发展的方法。纽约大学的神经系统科学家Gary Marcus成立了一个创业公司Geometric Intelligence来探索像小孩子学习那样从少数实例进行推断学习的技术。在其短暂的生命中,AlphaGo可能已经玩过了无数局游戏——比李世石多得多,但李世石仍然在五局中获得了一场胜利。“人类能够在很小的数据集中选出正确的方案,非常不可思议,” Marcus说,“可能人类的学习比计算机要快得多。”
如果您从中感受到数学的魅力了,
请支持一下小编!欢迎分享或赞赏!
热经典文章推荐: