我知道了
“阿尔法狗”为什么厉害

从3月9日开始,一场人与机器的围棋大战吸引了全世界的目光。对战的双方是世界围棋冠军李世石与围棋人工智能程序AlphaGo。AlphaGo最终以4:1击败李世石。这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣?它为什么如此厉害?

“阿尔法狗”是什么?

AlphaGo程序是一款人机对弈的围棋程序,被中国棋迷们戏称为“阿尔法狗”。

由于围棋每一步可能的下法太多,棋手起手时就有19×19=361种落子选择。一局150回合的围棋可能出现的局面多达10的170次方种。同时围棋的规律太微妙,在某种程度上落子选择依靠的是经验积累而形成的直觉,而计算机很难分辨当下棋局的优势方和弱势方。因此,围棋挑战被称作人工智能的“阿波罗计划”。

AlphaGo背后的科学家团队利用神经网络算法,将棋类专家的比赛记录输入给计算机,并让计算机自己与自己进行比赛,在这个过程中不断学习训练。某种程度上可以这么说,AlphaGo的棋艺不是开发者教给它的,而是“自学成才”的。

 

“阿尔法狗”怎样下棋?

AlphaGo通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。

深度神经网络最基础的一个单元就类似我们人类大脑的神经元,很多层连接起来就好比是人类大脑的神经网络。

AlphaGo的两个神经网络“大脑”分别是策略网络和估值网络。策略网络主要用来生成落子策略,它会根据输入棋盘当前的一个状态,预测人类下一步棋会下在哪儿,提出最符合人类思维的几种可行的下法。估值网络会为各个可行的下法评估整个盘面的情况,然后给出一个“胜率”。

AlphaGo判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。在利用蒙特卡洛树搜索算法分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

 

人工智能会对人类造成威胁吗?

AlphaGo成功的秘诀就是让计算机知道如何完成目标并通过经验来提高,而不是每项任务都通过手写指令来完成。计算机通过深度神经网络,模拟人脑的机制来学习、判断、决策。这种方法已被应用于许多领域,比如人脸识别、语音识别等等,它在近期和未来都将是人工智能领域的一个热点研究方向。

因为围棋的数据结构是一样和固定的,而我们生活当中很多的数据结构并不统一,比如城市拥堵方面的大数据结构,因此让计算机从这些非结构数据中获取知识目前还是非常难的,要实现还需要很长的时间。