云和教育:云和数据集团旗下高端ICT职业教育品牌
  • 国家级全民数字素养与技能培训基地
  • 河南省第一批产教融合型企业建设培育单位
  • 郑州市数字技能人才(码农)培养评价联盟

云和数据带你回顾人机围棋大战

  • 作者:云和教育
  • 日期:2016-03-19
  • 浏览:1,075次

     谷歌围棋人工智能AlphaGo今天与韩国棋手李世石的人机围棋大战尘埃落定,AlphaGo拿下最后一场,将总比分定格在4:1。双方联手为世人贡献了五场精彩绝伦的围棋比赛,比赛结束了,而相关的话题讨论才刚刚进入高潮。

关注
其实人们最关注的话题集中在以AlphaGo代表的人工智能是否会取代人类上,AlphaGo之父、DeepMind联合创始人德米斯·哈萨比斯表示,围棋是一种"完全信息博弈",比赛双方所有信息都呈现在棋盘上。而例如扑克和电脑游戏等由多人参与的对战游戏是"不完全信息博弈",计算机无法获知所有信息,目前这些领域对人工智能来说还存在困难。另外,对DeepMind来说,他们研发AlphaGo的最终目标指向为智能手机助手、医疗健康和机器人,只是目前先在围棋领域测试系统,达到检测其学习能力算法的目的。所以大可不必过于惊慌,将此番围棋较量上升至保卫"人类智慧最后一块高地"的地步。
哈萨比斯称,人工智能的下一步目标是让计算机自己学棋。也就是说,下个版本的AlphaGo将从零开始,不接受人类的灌输的特定知识,做到真正的自主学习。
回顾:
人机大战首局:李世石中盘认输

北京时间3月9日,李世石执黑先行,为打乱电脑布局采用新走法,AlphaGo应对不佳,出现失误。在中盘阶段的胜负关键时期,AlphaGo下法变得强硬,双方展开接触战。李世石围住一块大空,在大局上抢得先机。随后李世石却放出了非常业余的手法,瞬间使微弱的优势化为乌有,进入官子,AlphaGo根本不犯一点错误,着着精准,李世石算清后投子认输。
人机大战次局:李世石完败
北京时间3月10日, AlphaGo执黑先行,李世石转变行棋风格,开局下得非常稳健。AlphaGo也下出了不少新手,这让李世石应对得非常谨慎,黑37和41两步尖冲令人匪夷所思,尤其是第41手,致目数大亏。中盘阶段,本来形势占优的李世石行棋过缓,右上角的一步二路打拔被视作败手,AlphaGo的优势逐渐清晰起来。在形势陷入被动的情况下,李世石下出一手扳的好棋,但几次转换后,黑棋还是牢牢守住了领先的局面,而且棋形很厚。李世石无力改变,AlphaGo执黑获胜且优势明显,总比分2-0领先。
人机大战第三局:李世石破釜沉舟未果
北京时间3月12日,李世石执黑先行,布局阶段,李世石左下挂角后走高中国流。行不到二十手,李世石局面就落入下风。随后,双方在左上角展开战斗,AlphaGo对全局的把握一如既往地强大。李世石不但自己的模样被对手轻松打入,AlphaGo还借助战斗在下边围起一大块空,局面看上去还不如前两盘好看。随后的比赛,虽然李世石仍然极力抵抗,并且祭出劫争的手段,但是电脑精确应对,让他无功而返,只有投子认负。
人机大战第四局:李世石祭出"神之一手"获首胜
北京时间3月13日,李世石祭出白78"挖"妙手, AlphaGo被李世石的"神之一手"下得陷入混乱,走出了黑93一步常理上的废棋,导致棋盘右侧一大片黑子"全死"。 此后,"阿尔法围棋"判断局面对自己不利,每步耗时明显增长,更首次被李世石拖入读秒。最终,李世石冷静收官锁定胜局。
人机大战第五局:李世石执黑280手认负
在上局比赛扳回一城后,李世石向AlphaGo团队提出要在末战中执黑,因为他觉得AlphaGo执黑时发挥并不完美,战胜执白的AlphaGo才更有意义。执黑的李世石选择了稳健的错小目、无忧角开局,AlphaGo则以二连星应对。李世石和79和81手连出缓手,被视为败招。AlphaGo82靠也并非好的应手,一波错进错出后,黑棋在87和89手再出缓手,致使白棋左上角的围剿更加有力,黑棋形势瞬间坍塌。此后,占据优势的AlphaGo展现了它强大的中后盘计算能力,鲜有失误,落子效率极高。不过李世石也并未放弃,连续走出强硬应手,可惜棋盘下得越来越小,难再觅逆转机会。第280手,李世石投子认负。
AlphaGo原理
在人机大战开始前,职业棋手们几乎一边倒地倾向于李世石。就连这个性格执拗、棋风凶悍的韩国人也认为5比0不成问题,只是在开赛前了解到AlphaGo自我学习的原理后,才略有担心。其实在科技界人士看来,代表人工智能顶尖水准的AlphaGo胜出同样是大概率的事情。
传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。AlphaGo则是将高级搜索树与深度神经网络结合在一起,这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。
其中一个神经网络"决策网络"(policy network)负责选择下一步走法,另一个神经网络"值网络"("value network)则预测比赛胜利方。谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习(reinforcement learning)。通过广泛使用Google云平台,完成了大量研究工作。
AlphaGo在与人的对弈中用了"两个大脑"来解决问题:"决策网络"和"值网络"。通俗来说就是,一个大脑用来决策当前应该如何落子,另一个大脑来预测比赛最终的胜利方。
值得一提的是,李世石也是第一次与机器对战,所以他无法像和人类对战那样,先研究对方的棋谱和下棋风格。李世石所能做的就是和自己对弈。AlphaGo也是通过这种方式锻炼自己,真正做到了"人工智能"。
声音:
"这是我的失败,'阿尔法围棋'很强大。但这不代表了人类棋手的失败,更不代表围棋的失败。"–李世石九段
"棋道一百,我只知七。"–日本棋圣藤泽秀行九段
"AlphaGo就像是好莱坞影片《侏罗纪世界》里,人类暗中研究培育的那头变异暴龙。"–上海知名围棋教练夏胜浩
"职业棋手已经接受竞技角度上,AI超越人类的现实。但从思维方式上,AlphaGo会对棋手有更多帮助,局部方面的对抗,大局观的把控。"–上海棋院副院长刘世振
"人机大战的胜利者依旧是人类,人类制造了AlphaGo,这次比赛预估也将让欧美的围棋普及度增加5倍。"–韩国棋院院长洪锡炫
"世界上真正的挑战不是'人类对机器',而是人类利用机器与那些全球性难题之间的对决。'阿尔法围棋'对人工智能的发展和人类的发展都是积极的一步,今后它的水平还可能应用到医疗等其他领域,更好地造福人类。"–谷歌CEO桑达-皮查
“这绝不是围棋的终点,而是一个新的起点!我们正处在最好的时代,一个激动人心的科技发展的时代。人工智能、机器人、深度学习、VR虚拟现实这些将代表未来科技发展方向的事物我们都还在探索,云和数据现在正在主攻VR虚拟现实领域。”——云和数据CEO郭凯
 
网友吐槽:
       看了前三局本来想给孩子报个围棋班呢,第四局看完,得,还是给送到云和学院学编程吧!–云和小编阿凡
       我估摸着把李世石拆了,会发现有个阿尔法狗beta版本趴在里面–云和数据某程序员一
       李世石连输5局气急败坏地砸开电脑,发现柯洁趴在机箱里–云和数据某程序员二
       啊~啊~啊~九段,你比八段多一段;啊~啊~啊~九段,你比十段少一段;
       终于有一天,阿法狗来挑战,连输三盘怎么办,只好拔插线板~要是再输怎么办,要么麻将来两盘~–麻将哥哥
  我脚得,大杀器是这样的:下着下着,李世石从棋盘上拿起一粒棋子,"啪"的一声拍在棋盘另一个位置,大喊一声"将军" ,然后,阿法狗就当机了…–象棋弟弟
  我去都3.15了啊,阿尔法狗的产品质量问题有没有人能关注下?–打假达人
 "我叫李世石,我是一名来自韩国的棋手,今天早上出门前我在网上各大投注点用尽家财下了巨额赌注买我自己输,我想,这就是人类比人工智能强的地方。"–某直播员