三个多小时的比赛之后,裁判宣布,执黑子的柯洁以四分之一目的微弱劣势,败给了 AlphaGo。这场比赛在赛前就悬念不足,AI 的能力已经得到广泛的承认。发布会的前半段,专业棋手樊麾和常昊对本盘做了棋局回顾,提到值得注意的几步棋。例如,柯洁在局中第 7 手早早就出了 “点三三” 这一落子,这在传统棋局中,往往是在后程棋局比较密集的阶段才会出现的招数。
最早是 “阿老师”AlphaGo 在比赛中首先尝试,带动了一系列年轻棋手的学习风潮。在今年的早些时候其他围棋公开赛中,柯洁也在有意识地尝试这种打法的延展。
在下棋的过程中,AlphaGo 多次展示出职业棋手眼中不可思议的打法。比如一处,在棋手的观念中,用 “提” 会让这一区域白子更为厚实,而 AlphaGo 实际采取了 “大飞” 的策略。从局部来说 “提” 的策略更好,不过 “大飞” 的策略有助于白子向中央开拓区域。这一手充分说明了 AlphaGo 在全局把控上的能力。
在赛后发布会上,柯洁表示,在这场比赛之前,他已经研究过 AlphaGo 的打法,打点三三也是希望使用 AlphaGo 自己的策略来考验他的反应。依然,在整局棋的过程中,还是碰到了很多人类选手不会出的打法。印象最深的是一手是白子的 “断”,当时给他制造了不少麻烦,不过回想来看绝对是一步好棋。总体来说,AlphaGo“下得很出色,我输的没有什么脾气 ”。在和 AlphaGo 包括之前的 Master 对弈的过程中,他对围棋策略有了新的认识,最重要的就是,“没有什么棋是不可以下的”,很多 AlphaGo 的招数对于他来说也是一种学习。
柯洁还表示,现在的 AlphaGo,很难再找到缺陷,“以前的 AlphaGo 还是有弱点的。现在它对棋的理解、判断,已经远胜我们了。现在要取胜,只能找些 BUG 出来。和 AlphaGo 对战,是我的荣幸”。
DeepMind CEO 兼创始人 Demis Hassabis 认为,这是一场 “令人兴奋的一场比赛”,与柯洁的对弈推动 AlphaGo 探索它的局限,这也是 DeepMind 团队希望看到的。
DeepMind 的大牛科学家 David Silver 从算法角度讲解了 AlphaGo 一些看似不合理的打法出现的原因。对于 AlphaGo 来说,获胜的概率比获胜的程度更为重要。因而,他倾向于规避风险,尽可能谨慎地打完比赛,而非较为激烈地去争取棋盘上的区域。他也说明,与联网的 Master 账号不同,此次对战的 AlphaGo 是单机版本,基于 TPU(好吧这波谷歌广告我服)。
Demis 透露,在未来一周的人工智能论坛中,DeepMind 将发布更多有关 AlphaGo 的消息,包括新的版本和新的应用领域。
【via 科技视界】