关心下一代周报云报

上一期下一期上一版下一版

B2：百科

上一版

下一版

2016-03-25 出版

返回首页 | 版面概览 | 版面导航 | 标题导航

“阿尔法狗”为什么厉害

从3月9日开始，一场人与机器的围棋大战吸引了全世界的目光。对战的双方是世界围棋冠军李世石与围棋人工智能程序AlphaGo。AlphaGo最终以4:1击败李世石。这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣？它为什么如此厉害？

“阿尔法狗”是什么？

AlphaGo程序是一款人机对弈的围棋程序，被中国棋迷们戏称为“阿尔法狗”。

由于围棋每一步可能的下法太多，棋手起手时就有19×19=361种落子选择。一局150回合的围棋可能出现的局面多达10的170次方种。同时围棋的规律太微妙，在某种程度上落子选择依靠的是经验积累而形成的直觉，而计算机很难分辨当下棋局的优势方和弱势方。因此，围棋挑战被称作人工智能的“阿波罗计划”。

AlphaGo背后的科学家团队利用神经网络算法，将棋类专家的比赛记录输入给计算机，并让计算机自己与自己进行比赛，在这个过程中不断学习训练。某种程度上可以这么说，AlphaGo的棋艺不是开发者教给它的，而是“自学成才”的。

“阿尔法狗”怎样下棋？

AlphaGo通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。

深度神经网络最基础的一个单元就类似我们人类大脑的神经元，很多层连接起来就好比是人类大脑的神经网络。

AlphaGo的两个神经网络“大脑”分别是策略网络和估值网络。策略网络主要用来生成落子策略，它会根据输入棋盘当前的一个状态，预测人类下一步棋会下在哪儿，提出最符合人类思维的几种可行的下法。估值网络会为各个可行的下法评估整个盘面的情况，然后给出一个“胜率”。

AlphaGo判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样。在利用蒙特卡洛树搜索算法分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。

人工智能会对人类造成威胁吗？

AlphaGo成功的秘诀就是让计算机知道如何完成目标并通过经验来提高，而不是每项任务都通过手写指令来完成。计算机通过深度神经网络，模拟人脑的机制来学习、判断、决策。这种方法已被应用于许多领域，比如人脸识别、语音识别等等，它在近期和未来都将是人工智能领域的一个热点研究方向。

因为围棋的数据结构是一样和固定的，而我们生活当中很多的数据结构并不统一，比如城市拥堵方面的大数据结构，因此让计算机从这些非结构数据中获取知识目前还是非常难的，要实现还需要很长的时间。