AlphaGo是否代表了人工智能的成功和未来

日期：2016-3-14 （来源：互联网）

相信在最近几天时间里无论是否关注围棋，只要你是一个拥有基本社交关系的正常青年，一定都被AlphaGo VS. 韩国职业九段围棋棋手李世石（或李世乭）的重磅对抗新闻刷了无数屏。对阵双方是Google旗下DeepMind公司[1-2]开发的AlphaGo围棋人工智能（Artificial Intelligence, AI）程序和韩国乃至世界顶级围棋高手李世石，DeepMind试图证明AI科技可以使冰冷的计算机具备人类思考意识，以期未来布局到游戏、医疗、机器人以及手机等领域从而更好地服务人类；而李世石作为代表人类的一方，则试图抛开人类的偏见和自负，承担起捍卫圣杯的义务（当然，胜利一方将获得$100w美金奖金）。遗憾的是李世石目前已经输掉了整场比赛，被AlphaGo以3: 0的比分毫无悬念摘下这场天王山之战的胜果（按照官方赛制规定比赛采用5局3胜制，无论哪一方提前胜出都要下满5局），现在社交网络上的风评已经由讨论比分几比几转变成讨论李世石到底能不能扳回哪怕一城？(创事记注：在13日进行的第四局比赛中，李世石战胜AlphaGo，获得了其在本次系列赛的首场胜利。)透过直播甚至能看到比赛期间李世石频繁摇头叹气，赛前誓言要5: 0血洗AI的豪气早已不复存在，私下里还被网民戏谑为“Google高级软件测试工程师”。

前三场比赛的比分

如果不出意外，这场比赛将会以人类一方被5: 0的血洗终结并载入AI科技发展史。AlphaGo内部的增强学习机制只会让其棋艺越来越专业，而且机器不会受情感波动的影响稳定发挥，所以现阶段压力几乎全扑向李世石一边，剩下两局已经不再是输赢的问题了，这对他旗艺的发挥必然造成影响。

这场比赛为什么空前受瞩？

此役之前，AlphaGo曾以5: 0的大比分轻松横扫欧洲围棋冠军樊麾，初步证明了AlphaGo的围棋“思考”能力已经具备围棋大师赛水准。按照最新的Elo分数世界排名（http://www.goratings.org/），樊麾以2986分排名世界第513 / 827位，属于职业二段棋手，而李世石的得分是3520，世界排名第4 / 827（2007-2011年间世界排名第1，近几年长期盘踞前4状态），属于职业九段棋手，几乎代表了人类围棋博弈的智慧顶峰，所以这场比赛和1997年IBM的计算机程序“深蓝” VS. 加里·卡斯帕罗夫那场国际象棋大赛地位相当。

Elo分数排名和分布

从解空间大小来看国际象棋的穷举解空间只有10^46，而围棋的穷举解空间高达10^172，即使穷尽整个宇宙的物质也存不下围棋的所有可能性（宇宙中的原子总数是10^80），针对每一步落子的棋局分析和剪枝优化判定都比国际象棋复杂得多。很多没有算法概念的小白一厢情愿地认为只要用足够多的计算资源进行暴力穷举（brute-force）就能得到最优解，这种心态类似著名的猴子无限定理中所描述的：让一只猴子在打字机上随机地按键，当按键时间达到无穷时，几乎必然能够打出任何给定的文字，比如莎士比亚的全套著作。不过在现实中，猴子打出一篇像样的文章的概率是零，因为科学家经过反复试验后发现，猴子在使用键盘时通常会连按某一个键或拍击键盘，2003年，某个科学家做了这个实验，结果打出了5张全是‘S’的纸。最终打出的文字不可能成为一个完整的句子。这是因为现实是非常大的有限，而不是严格意义上的无限。

AlphaGo解空间示意图

AlphaGo是什么，有何厉害之处？

通过阅读AlphaGo发表在《Nature 2016》上的文章Mastering the game of Go with deep neuralnetworks and tree search[3]可以了解到：

Abstract: The game of Go has long been viewed as the most challengingof classic games for artificial intelligence owing to its enormous search spaceand the difficulty of evaluating board positions and moves. Here we introduce a new approach tocomputer Go that uses ‘value networks’ to EVALUATE board positions and ‘policynetworks’ to SELECT moves. These deep neural networks are trained by a novelcombination of supervised learning from human expert games, and reinforcementlearning from games of self-play. Without any lookahead search, the neuralnetworks play Go at the level of state-of-the-art Monte Carlo tree searchprograms that simulate thousands of random games of self-play. We alsointroduce a new search algorithm that combines Monte Carlo simulation with valueand policy networks. Using this search algorithm, our program AlphaGoachieved a 99.8% winning rate against other Go programs, and defeated the humanEuropean Go CHAMPION by 5 games to 0. This is the first time that a computerprogram has defeated a human professional player in the full-sized game of Go,a feat previously thought to be at least a decade away.

AlphaGo的神经网络训练模型和架构

通俗地讲，AlphaGo就是一套针对围棋周密设计的深度学习引擎，采用多种机器学习技术进行整合：增强学习（reinforcement learning），深度神经网络（deep neural network），走棋网络（policy network）、快速走子（fast rollout）、估值网络（Value Network）和蒙特卡洛树搜索（Monte Carlo tree search, MCTS），加上Google强大的硬件支撑和云计算资源，结合CPU GPU，通过增强学习和自我博弈学习不断提高自身水平[4-5]。值得一提的是，paper两位主要作者之一的Aja Huang（一名低调的台湾教授，另一位是David SILVER）也是一名围棋爱好者，目前水平已经达到业余六级（普通人一般是业余二级），整个AlphaGo主要来自两位在博士阶段及毕业以后五年以上的积累。

在未来，AI科技能否超越人脑？

自1956年AI这个概念被提出并确立以来，一共经历了符号主义→ 专家系统→ …→ 统计学习→ 神经网络→ 深度学习等几大重要阶段，尤其是近十年来对深度学习的研究使得AI在历经神经网络发展低潮过后再一次空前崛起。回顾过往，历史上比较著名的AI对抗人类智慧事件共有三次：

1.1997年IBM的计算机程序“深蓝”在国际象棋大赛中以3.5: 2.5 （2胜1负3平）战胜加里·卡斯帕罗夫，当时使用的是人工调整的评估函数，而且是用特殊设计的硬件和“暴力”的搜索。

2.2011 - 2012年，吴恩达（Andrew Y. Ng）在Google Brain搭建了一个拥有1.6万多个微处理器、数十亿连接的神经网络，通过观看千万数量级的YouTube图像后，无监督地从里面自主辨识出了“猫”这种生物。然而这样一个庞大集群却也只能达到一个几岁孩子的思维水平。

吴恩达现就职于百度，担任公司首席科学家，负责百度研究院的领导工作，尤其是Baidu Brain计划。

3.近期，Google旗下DeepMind的AlphaGo与韩国职业九段围棋棋手李世石的围棋对抗，目前比分为AlphaGo: 李世石 = 3: 0，AlphaGo胜。

那么，若AlphaGo赢下全部五局比赛，是否意味着AI科技进入全面应用的智能生活时代？不尽然也。按照智能程度分类，AI可以分为强人工智能和弱人工智能，强人工智能的观点是让机器真正的思考（can machine really think），弱人工智能的观点是让机器智能的行动（can machine act intelligent），本质上现有的大多数AI系统包括AlphaGo都还处于弱人工智能阶段，人工投入越多，智能的表现就越多，机器只是执行人类复杂程序命令，并不具备类人情感情绪和思维思考。注意到对AI的分类并不是以解空间大小作为标准，像语音 / 图像搜索、机器翻译、智能家居和无人驾驶等即将或已投入使用的AI科技的计算体量都比AlphaGo小得多。

谷歌人工智能软件首赢韩国选手李世石看上去是一座里程碑，它似乎意味着电脑已经能做任何人类所擅长的事，但事实并非如此。世界上还有无数人类能够完成的任务，是电脑难以接近的。“世界上最强大的力量应当是人类本身，而不是一把铁锹或者核潜艇。人类制造的产物不讲道德和感情，但他们拥有力量，这种力量的快速增长往往让人类感到恐惧。”——英国《卫报》

让电脑模拟出人类思维方式是一件很难的事情，计算机能正常运转是通过按部就班地执行一行行程序代码实现，这些代码指令最终都会变成0和1的二进制机器码。

l语音搜索

一个简单的搜索引擎案例，当你想了解黄晓明的家人都有谁时，会在搜索框中输入“黄晓明的老婆是谁”，结果是Angelbaby，但如果你想继续了解“黄晓明的妈妈是谁”，就必须重新执行第二次搜索动作才会得到结果。试想一下如果搜索引擎具备了人脑的思维方式，整个过程将会变成：“黄晓明的老婆是谁”→“Angelbaby”→“妈妈呢”→“张素霞”，相当便捷。如果将这种搜索方式以语音的方式交互，省去在小块手机屏幕上打字输入的烦恼，对搜索用户体验将带来极大的提升。语音搜索是一种结合多种AI技术的典型应用，包括但不限于语音识别（speech recognition）、自然语言处理（natural language processing, nlp）、机器学习（machine learning, ml）和对数据的挖掘（data minging, dm）和呈现（data visualization），实现过程相对于单一任务、封闭式规则的围棋项目要复杂许多，可以通过语义理解与多轮对话精准识别你的需求，带有一定的思考判断能力。在未来，语音搜索可以应用到例如智能硬件服务、汽车导航助手、基于语音特征的金融支付、新闻媒体和咨询顾问等行业中，不排除未来发展成为强人工智能的趋势。

电子百科

产品导航

AlphaGo是否代表了人工智能的成功和未来

相关资讯

关键字标签

IC37:专业IC行业平台