淘客熙熙

主题:与狗的第三局大战,李的臭棋很多 -- hwd99

共:💬14 🌺30 新:
全看分页树展 · 主题 跟帖
家园 【整理】李喆六段对前四局的分析(原文发自喆理围棋公众号)

(没找到微信文章的链接方法,全文转载了。)

0 对前两篇文章的回顾

第一篇《李世石的策略与AlphaGo的弱点》的开头,分析李世石第一次面对AlphaGo时所采用的试探和策略。然后指出传统意义上AlphaGo下出的失误和好棋。之后谈到AlphaGo失误在算法上的原因,以及人和AI对失误的不同定义。第5节,通过对棋谱和算法的分析明确提出AlphaGo的两个弱点:逻辑缺失、逃避劫争。第6节,针对这两个弱点对李世石第二局的策略进行了预测和建议:套路开局、制造劫争。

在第二篇《这两盘棋,没人比李世石做得更好》,首先分析了“协议禁劫”为什么不可能。

之后讨论了AlphaGo的算法决定其落子的决策基于“胜率”而不是“最优”,并分析了李世石在第一局的策略和表现。在此基础上,分析了李世石第二局的策略和行为,指出AlphaGo的强大(和不完美),以及误判它实力的原因。之后,指出李世石面对AlphaGo所做出的种种努力,以及围棋Ai作为参照者对于人类探索围棋的重要意义。第5节,分析了后三盘可能的情况。最后,由算法得出向AlphaGo学棋的陷阱和巨大价值。

1 第三局李世石的策略

让我们进入正题。我将AlphaGo为我们敞开的新世界留在下一篇来描绘,在这一篇,我们还是切入李世石的视角,看看在第三局和第四局中他究竟做了什么,又是如何得到了第一次胜利。

在前两局,李世石通过不同的策略得到了很多可以转化为人类语言的信息,概述如下:

第一局

1, 通过“无谱布局”得知AlphaGo不依赖背谱

2, 通过“避开定式”得知AlphaGo选点基于全局

3, 通过“开放式复杂局面”得知AlphaGo不怕乱战

4, 通过“细棋局面”得知AlphaGo存在逻辑缺失导致局部亏损的弱点(因算法导致的优势退让)

第二局:

1, 通过“常规布局”得知AlphaGo会有“创新”下法

2, 通过“均衡局面”得知AlphaGo此局面下后半盘极强

3, 通过对手下法得知AlphaGo存在逃避劫争的倾向(在第一局也能看到,但第二局更为明显)。

如果你获得了这些信息,你会如何面对第三局?

在上一篇文章的第五节,我预测李世石会试一试劫争,虽然可能并没有用。另外我认为空中开局会比较有趣,或许能见识到很多新东西。

从争胜的角度,还是用“常规布局”优于“无谱布局”。这是因为,对于人而言,“常规布局”是历史上棋手整体的经验结果,而AlphaGo不背谱,常规与否对于它并无差异。

确定了布局方法之后,还要制定布局策略,才好最终选择布局。在第二局中,李世石得知均衡局面下AlphaGo后半盘极强,“失误”减少。如果选择均衡将很难取胜,因此寄希望于前半盘取得较大优势。

1, 常规布局;2,争取大优…..满足这两个条件最好的开局是——大模样!

李世石选择了左下先挂的高中国流,这是现代最典型的大模样开局

大模样开局的特点是:一,容易形成攻杀局面;二,优劣出入比较大。

果然,AlphaGo第12手挂入,给了黑棋开局攻杀的机会。

李世石13、15两手。都是在有两种选择的情况下选择了最为凶狠的下法。

第二局结束之后,很多人质问李世石为什么失去了血性,为什么那么稳健地输了。在我看来,这是李世石的策略而已,他在第一局找到的电脑可能的弱点,在第二局中以这样的方式来针对。即使他并不擅长从头到尾均衡平和的局面(那是李昌镐所擅长的),他仍然坚定地贯彻了这一策略。当然,针对性策略在某种程度上确实会束缚住他,加上心理上不可避免的压力,在技术上难以发挥到极致,这是不应苛责的。

也有一种观点是,干嘛要去找电脑的弱点,做好自己就行了。去找对手的弱点本身就做得不够好。

的确,大部分棋手都不会考虑对面坐着的是AlphaGo,只要下好自己的棋。但是,每个棋手在每局棋中都会有面临两难选择的时候,此时如何选择,在我看来都是做自己。

《孙子兵法》云“知己知彼,百战不殆。”了解对手,既是为了更好地争胜,也是对对手极大的尊重。

如前面所说,如果没有李世石前三局根据AI的回应而不断变换的进攻手法,我们就不可能如今天这般全面地了解AlphaGo在围棋盘上的特点,也难以取得第四局这样艰难而酣畅的胜利。反过来想,即使真的在第一局就出现了第四局这样的情况,我们对AlphaGo的误判将会达到什么程度?

回到第三局,李世石布下了大模样开局,在对方深入之时选择了最为强烈的攻杀手段,希望在棋局前期取得大优。

但是,我们看到了AlphaGo近乎完美的处理。

白16,这手棋基本上否定了黑15的下法。过程中黑21应有疑问,但这是作为对局者在实战之前很难确认的事情。

白32,基本上宣告了李世石此局策略的失败。

对于AlphaGo而言,它本身并没有“治孤”这样的概念,但在第三局,它面对李世石选择的这种局面时,表现出强大的能力。

基本上所有的棋手在第三局之后都认可了AlphaGo的实力在人类棋手之上,这是因为,AlphaGo以所有棋手都看得懂的方式轻易地化解了李世石开局的凌厉攻势,取得了完胜。

这局棋,白棋的反击得手之后,已经是李世石崩溃的局面。但李世石的强大之处在于,在这样的局面下他仍然做出了新的试探。

黑77手,考验AlphaGo处理局部与全局关联的能力。

黑115手以下,考验AlphaGo杀棋的能力。李世石在对阵人类选手时虽然也会有劣势下考验对方的手段,但这一手显然是只针对机器。

最终,李世石在下方做出了一个劫争,这一结果虽然与AlphaGo在优势下的退让有关,但也确实是李世石才能做到的事情。

某种意义上,当我们见识了AlphaGo第三局这般漂亮的前半盘,就很难在同一盘棋中再见到AlphaGo第二局那般强大的后半盘。作为棋手,对这一点感到些许遗憾,这是它基于胜率的算法所决定的。

至于后面的劫争,对于很多人而言是证伪了“AlphaGo不会打劫”和“协议禁劫”这两件事情,但在我看来不过是对逻辑推理得出的确定结论的一次事实呈现。

由于前二局的信息,这一局李世石制定了在前半盘争胜的策略,采取了大模样战法。采用这一方法的原因其实有一点无奈,因为在第二局结束之后李世石表示“没有找到AlphaGo的弱点”。于是他只能从“均势下AlphaGo后半盘极强”这件事来逆推,得出需在前半盘争胜的结论。但是,在争胜策略失败之后,李世石在后半盘的努力却为第四局的胜利埋下了伏笔。

2 第四局李世石的策略

笼统地说,李世石在前三局考验了AlphaGo面对乱战、细棋、治孤时的能力,AlphaGo的应对非常有说服力。

但是,李世石在第三局赛后的感言中已经不像第二局那般毫无头绪。他找到了或许是最后一种针对AlphaGo的攻击方式:让AlphaGo攻杀。

也就是说,李世石选择导入自己治孤的局面。

这策略是仅有的可选策略之一,第三局AlphaGo在下方的攻杀退让也增强了施展这一策略的决心。

从计算的意义上,攻杀比治孤更难。

这是因为,治孤只要求自己做活,只要找到自己能活的图就可以;

而攻杀要求杀死对方的棋,必须防范对方所有可能的反扑,对于AlphaGo而言,需要搜索的空间就大幅增加。

李世石找到这一策略,是相当聪明的选择。

也正是李世石出乎AlphaGo预料(在搜索树排名靠后)的一手棋(78),使AlphaGo在优势下突然崩溃,一举逆转取得了胜利。

AlphaGo第23手在此时靠,对于职业棋手而言是不可思议的一手。我会在后一章描写我看到的围棋新世界里详细阐述这一手为何出乎预料,又有什么精妙的含义。

总之,李世石在左边选择了实地,任凭黑方筑起外势。虽然左边的下法在职业棋手看来是白棋过于忍让,但考虑到李世石的策略,加上对23手的认知,就会明白李世石为什么这么下。

白40,进入“先捞后洗”的局面,逼迫AlphaGo攻杀。

黑47-51——又是非常值得学习的新颖下法,具体的解析我想放在下一篇文章。

“神之一手”,白78挖!

很多棋手已经解释过,这手棋原本并不足以逆转,黑棋有数种应对可保优势。

比如1位顶吃,白棋并无生路。

另一种下法是在1位拐吃,如此则白棋可以通过打劫联络,但黑21跳出后形成转换,仍然是黑方胜势。

虽然第78手本身不足以逆转局势,但无法抹杀这一手的闪耀光芒!

这是人类思维灵感涌动的时刻!

这一手很可能满足了如下几个条件:

1, 跳出了AlphaGo之前的搜索范围

2,使变化更多,增加了局面的分支

3,涉及到可能的劫争

同时满足这三个条件,非常不容易。

,

至于AlphaGo为何会出现实战那样的失误,大家可以参考Facebook田渊栋博士的分析,以及期待Deepmind五局赛后的官方回应。

在上一篇文章里,我这样评价李世石前两盘的表现:

“李世石面对AlphaGo,并未因五个月之前的棋谱而有丝毫轻视,他做了非常充分的准备。他抛开人类的偏见和自负,试图理解AlphaGo运算的机理,并找出其中可能存在的弱点。在比赛伊始,他就对AlphaGo可能存在的弱点进行了直指要害的攻击,并且在失败后迅速调整,继而展开了第二次、第三次针对性攻击。正是他的策略针对性,使人们更好地理解了AlphaGo的强度和特点,以及不同于人类的决策模式。他在第二局中就已经找到了足以在中盘接近甚至抗衡AlphaGo的布局策略,使人类第一次见识到AlphaGo梦幻般的后半盘。”

在第四局之后,相信会有更多人理解我当时对李世石的这一评价。

而对于李世石在第三、四局里的表现,我想这样评价:

“李世石在找不到AlphaGo弱点的情况下,仍然继续寻找策略展开进攻。经过前三局不同方式的失败,李世石在第四局又找到了新的策略,并非常好地执行了策略。这一次,他成功了。AlphaGo在面对“神鬼莫测”的第78手时,终于展现出足以被人类击败的弱点。虽然这一突破所需的条件目前尚不能完全肯定,但无疑李世石已经成功。这场胜利,是对他前三场努力的最佳回报。”

3 作为职业棋士如何看待人机之战

对于我而言,这一场人机之战给我最大的震撼来自于棋谱。AlphaGo下出了许多完全在人类棋手经验之外的着法,这些着法在目前尚不能得到人类棋手统一的理解。

但是,我隐隐读到了这些着法背后壮美的天地,这壮美天地当然不是AlphaGo所创造,而是有四千多年历史的围棋本身所自有的丰富与辽阔。

AlphaGo并不是解开了围棋之谜,它离穷尽围棋还有非常远的距离,它只是向我们展开了这样一个新世界。

我们需要用多久才能理解?或许一年、五年、十年……但我相信,人类一定能够用理性的方式去不断地理解这些数据给出的信息,AlphaGo的出现恰恰证明了人类理性的重要价值。

由于围棋是一个封闭空间,其变化数虽然巨大,但仍然是有限的、在理论上可穷尽的。如上一篇里谈到的,如果把穷尽看做天,把入门看做地,人类在围棋的天地之间到底处于什么位置,这是值得每一个对围棋有感情的人去认真思考的问题。而AlphaGo的出现既使我们有了一个参照者,使我们居于这天地之间不再孤独;又使我们能够更好地接近围棋真理哪怕一点点。

这是我在第二局后喜极而泣、心生无限欢喜的根本原因。

感谢李世石,感谢AlphaGo。

在第一篇文章的结语,我说

“如果我们只用人类思考围棋的方式来理解AlphaGo,或许我们将永远都不知道是怎么输的。”

现在更多的职业棋手已经知道AlphaGo在棋盘上做出决策的方式特点。接下来,要做的事情是:

“将AlphaGo展现出的新世界以人类理性的方式来理解,这是作为棋士对围棋和人类理性最好的致意。”

让我们共同期待传世的第五局!

关键词(Tags): #策略#劫争#定式#算法#细棋
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河