主页 > 访谈观点 >战胜电脑取围棋首胜!李世乭:找到了AlphaGo的弱点 >

战胜电脑取围棋首胜!李世乭:找到了AlphaGo的弱点

原创 访谈观点 作者: 时间:2020-07-10 20:38:31 227
战胜电脑取围棋首胜!李世乭:找到了AlphaGo的弱点

人机战第4回,李世乭在输掉3场后,终于取下首胜。
李世乭随即出席赛后记者会,现场媒体一片欢呼声、热烈掌声,齐声高叫「李世乭!李世乭!」而看起来李世乭连日比赛真的很紧张,有很大的压力,今日取得首胜,终于开了一个玩笑,他说人生第一次只赢一场比赛而受到这幺多祝贺。李世乭说回想起赛前豪言赢4比1或5:0,因为早前输了3场,现在能赢到一场,认为这场胜利十分宝贵,其他任何东西都没法交换。
李世乭说发现AlphaGo的两个弱点,他指AlphaGo用黑子面对白子时,当遇上一些不在预期的步法,AlphaGo就有机会出现错误,而且AlphaGo用黑子下棋时会犹疑更久。对于今次战胜AlphaGo,中国九段棋手古力指第78子是「神下的一子」,李世乭说就那一刻而言,那是他唯一看到会下的一子。而一直在YouTube直播中为赛事评述的Michael Redmond表示,李世乭当时作出了漂亮的一着,令所有「人」都吃惊了,那包括AlphaGo。
不过,李世乭表示,因为今次用白子赢了AlphaGo,也很想用黑子能战胜AlphaGo,所以跟同场的AlphaGo开发商DeepMind创办人Demis Hassabis要求,希望第5仗用黑子比赛,而Demis Hassabis也答应了。
关于比赛中段AlphaGo的失误,Demis Hassabis指AlphaGo一直表现很好,但李世乭的优秀表现逼使AlphaGo也犯错了。但他十分开心,因为这也是他们到韩国的原因,DeepMind需要李世乭这样的天才去发现AlphaGo的问题,才能改进系统。他强调今次的落败很重要,会回英国分析今次的经验,再改进系统。Demis Hassabis又再次称讚李世乭,指他就是世上难得数个能帮到他们的人。
今次是AlphaGo对抗人类9场比赛的首次败阵,不少人都好奇AlphaGo如何宣布投降。DeepMind研究人员David Silver解释,AlphaGo如果在比赛中发现胜率十分低,就会发出信息放弃比赛,亦即是投降。
战胜电脑取围棋首胜!李世乭:找到了AlphaGo的弱点
电脑屏幕显示"AlphaGo resigns"及"The result "W+Resign"was added to the game information"。
AlphaGo开发商DeepMind创办人Demis Hassabis比赛期间在twitter即时更新,指AlphaGo在第79步犯了错,更有趣的是,AlphaGo在第87步才发现,「错误出现在第79步,但AlphaGo在大概第87步才认清这现实」。
Demis Hassabis在twitter上指AlphaGo在87步时出现「混乱了」:
之后他再解释清楚AlphaGo甚至一度不知道自己「犯错」:
Demis Hassabis又说,在第79步的时候,AlphaGo觉得自己的胜率是70%,但之后就一直下滑:
最后,虽然DeepMind的代表AlphaGo输掉了首仗,Demis Hassabis还是祝贺李世乭获胜:
之前一直有人提出,AlphaGo与李世乭的比赛对李世乭不公平,因为AlphaGo有大量关于李世乭的数据,而李世乭没有AlphaGo的数据。李世乭回应指那不是问题,更直指之前的三连败是他自己的能力问题。而AlphaGo开发商DeepMind创办人Demis Hassabis也解释,AlphaGo的设计不是为了打败李世乭,AlphaGo是透过与自己不停的对战变得更强。期间,AlphaGo要数以百万场的比赛去训练。
这次AlphaGo使用的不是单机版的而是能力更强大的分散式版本
AlphaGo 实际上有两个版本,一个是「单机版」的,另一个是「分散式」的,两者的演算法完全相同,差别在于所用的硬体。
单机版 AlphaGo:拥有 48 个中央处理器和 8 个图形处理器。
分散式版 AlphaGo:拥有 1,202 个中央处理器和 176 个图形处理器。
做为比较,在 AlphaGo 之前的几个围棋人工智慧程式,CrazyStone 只有 32 个 CPU,而 Zen 只有 8 个 CPU。
AlphaGo 的棋力到底有多强呢?单机版 AlphaGo 曾经与 5 种围棋程式进行了 495 场比赛,对手是 CrazyStone、Zen、Pachi、Fuego 和 GnuGo,AlphaGo 全部取得压倒性的胜利。即使是让 4 子,AlphaGo 对 Crazystone 和 Zen 的胜率也达到了 77% 和 86%。
至于分散式版的 AlphaGo,如果对上自家的单机版 AlphaGo,则分散式版本的比赛胜率是 77%。
当初与欧洲围棋冠军樊麾对阵的是分散式版 AlphaGo,正式比赛成绩 5:0。如果以人类的棋力来看,AlphaGo 可能进入到 100 名以内。而在这次与李世乭的比赛过后,甚至可能进入前 10 名。
文整理转自 T客邦/The News Lens
相关文章