李喆:申真谞赢在哪里? 写在农心杯之后
文章来源:喆理围棋
申真谞在农心杯取得跨赛季的16连胜,超越当年李昌镐14连胜的传奇纪录,作为主将凭一己之力击败所有中国队参赛棋手,连续四届终结三国擂台赛,再次证明了他是当前毫无争议的围棋世界第一。
在这里,我想谈谈对申真谞的印象,包括他的棋艺和品性。棋艺方面,主要想谈谈小申的棋究竟领先在什么地方,尤其是从AI训练的方法以及围棋技术领域的理论层面进行简要分析,这部分基于知识理论的分析或许能够对我们的一线棋手乃至年轻新秀们有所助益。之所以在棋艺之外也想谈谈品性,是因为仍有许多人相信棋如其人,相信绝顶高手的人品风范一定与棋艺相通,这两者几乎不可分割——这种信念在前些年实际上遭到了严重的质疑,不仅有来自社会的疑问(人们在问:棋下得好与电竞打得好有什么区别吗?),许多棋手自身也都对此产生怀疑(也包括学棋的小孩和家长们),但幸运的是,申真谞似乎至少暂时挽回了这种信念。
很多棋手都喜欢用吴清源大师的折扇,最常见的题字是“闇然而日章”,大家或许更多是出于对吴清源卓越成就的钦佩,没认真考虑过吴清源大师为什么题这五个字在扇子上。“闇然而日章”出自《中庸》:“君子之道,闇然而日章;小人之道,的然而日亡”,“闇”在这里的意思与“暗”相通,这句话的意思大致是说,君子锦绣谨藏于中,初看闇然无光彩,而其德性光明是日益彰显出来;小人则相反,日夕用心于外,一心炫耀不知内省,徇物欲而忘返,初看表面光鲜,而其内在空洞,“暴于外而无实以继之”,于是日渐衰亡。吴清源大师晚年畅想21世纪的围棋,提出围棋乃“中和”之道,推崇《中庸》,将“闇然而日章”题于扇面传世,显然传达了他的人生理念和围棋观。
申真谞,这位出生于21世纪第一年的棋手,在攀登棋艺高峰的路途中,展现出“闇然而日章”的君子之道,逐渐成为一名大棋士的同时,也成为未来许多学棋小孩心中的榜样——对于整个棋界来说,这都是幸事一件。
首先,申真谞现象级的统治力至少证明了一个说法的谬误。围棋AI普及之后,曾有一种论调说AI拉近了棋手之间的水平差距,大家都跟AI学,所以水平都差不多了。如今申真谞连年接近90%胜率、几乎比肩当年李昌镐统治力的成绩显然证伪了这个说法。很明显,并非大家都学AI就会达到相近的水平。尤其我们国内的棋手们,不要再被这个说法欺骗了,AI的确带来了巨大的平等,但这平等主要是训练条件的平等(在大家都有强AI用作日常训练之后),而不是训练效果的平等。AI的出现实际上对棋手的能力提出了更高的要求,这一点需要一线棋手和致力于竞技的小棋手们认真对待,这也是我主要想谈的部分。
几无争议的是申真谞达到了目前为止人类围棋的最高水平(当然,人类围棋的水平整体上是不断提升的,未来无疑会出现层级更高的棋手)。那么,申真谞是如何达到这个高度的?在攀登棋艺高峰的过程中,他经历过什么低谷与困境?他的技术主要领先在哪里?
很多人都注意到了,申真谞近年的对局一改当年的战斗型风格,变成了控盘流,农心杯的一串六,除了最后面对中国队主将辜梓豪的一局有过一段比较大的波澜(证明小申也有足以导致败局的明显失误),其它五局都是从头控到尾,让对手毫无胜机。
这里我想先提出一个简单的论点:在现代围棋的职业竞技中,统治力最强的棋手极大概率会是控盘型棋手。这是一个通俗的说法,之后我会用围棋技术领域的理论来解释为什么这么说。
当然小申的战斗力或者说计算力是很强的,当年他刚刚走进世界赛场,就是典型的战斗风格,而他那段时期的输棋很多都是优势之下行棋过刚而折(还记得首届新奥杯八强战,我和申真谞同场竞技,抽签仪式上我很想对上他,因为他是当时八强里唯一的非中国队选手,而且如此年轻。那时我已多年不训练、偶尔参赛,逐渐退出一线,而小申算得上初出茅庐)。
围棋AI出来之后(尤其是KataGo于2019年开源之后),小申通过向AI学习,逐渐弥补了他的短板,风格变化为控盘型,胜率也达到了罕见的惊人高度。
其实围棋里各种“风格”的说法是可为趣谈而不那么精确的。所谓“控盘型”,无非是指常常在不怎么发生激烈战斗的情况下通向胜利,让对手有力无处使,这种风格能避免复杂计算中人类难免的波动,使局面平滑而有容错率,由此保持极高胜率,但是并非所有“控盘型”棋手都能达到那样的高度。上一位控盘型的高峰当然就是李昌镐,大李的巅峰期就是那种看上去平平无奇,却能把对手控制得找不到机会的下法。如今用AI来重新分析,李昌镐最强的地方还不是官子,而是局面的判断,很多当年被认为是李昌镐官子逆转的棋局,其实并非逆转,而是大李更准确地判断出了他实际占优的结果,对手和观众则误判了局面(至于怎么做到的,以后有机会再展开来谈)。而在李昌镐职业生涯的末期,之所以他一度被认为变换了风格,变成有些靠近“战斗型”,是因为在他的影响下,年轻棋手们的判断力和胜负感也都逐渐增强了,当判断能力没有显著差距时,控盘流就很难轻易得手,而常常需要战斗(双方前景不明的多头绪计算)来解决问题,到了那个阶段,他的胜率和统治力就下滑了(那也是我在国家队参与集体研究二李的时期)。
也就是说,控盘的关键是“判断力”。这里我要提出一个论点:如今申真谞领先最多的部分,就是“判断”的能力,而这显然是他用AI训练来提升的。
职业棋手们常说:“判断是围棋里最难的”,那么判断到底是指什么,为什么最难,又怎样提升呢?限于篇幅这里也只能简单谈一下,以后有机会再展开全面论述。
在编《中英围棋术语辞典》的时候,我发现围棋里的很多术语并没有严谨的定义,而不严谨的术语无法导向严谨无误的知识。在说到围棋技术领域的时候,“中盘能力”这类词的指涉就比较缺乏清晰性,而“判断”的概念是比较清晰的。
七年前,我在“AlphaGo——未来的围棋”这篇文章里第一次提出围棋技术的三要素:棋感(直觉)、计算和判断(这三者恰好对应着AlphaGo的算法结构),人类下棋的能力与技术可以全部涵盖在这三个概念的框架之下。去年我写了一篇论文“围棋的知识结构分析”,在论文的主题之外,文末顺带提到人类棋手通过使用AI学习,在这三个方面分别能带来多少进步及进步空间,结论是:在棋感方面会以累积经验的方式持续进步,在计算方面进步空间极小,而在判断方面则有很大的进步空间,并且未来还有产生理论化的可能。
所有定式的记忆,都可归于棋感一类。在围棋上学习AI的第一阶段,就是学AI的棋感,也就是多看AI的下法,产生相同或相近局面下的比原先更好的局面印象,而围棋的布局阶段最容易出现“相同或相近局面”,因此也是棋感部分最容易学到的,俗称“背定式”(不那么准确)。这个阶段,人类棋手重新学习定式,成为职业高手必备的功课,但这并不是全部的学习。布局下法之外,中盘转换的棋感、局部好坏形状的棋感、厚薄关系和何时脱先的棋感等等,都有更新的空间。这部分的训练是以经验累积为主,见得多了就认识了,当然从见得多到真正认识,也需要对不认识的、看不懂的下法进行仔细的理解分析,才能真正地转化为自己的棋感。
有些棋手和棋迷误以为这就是跟AI学习的全部,由此认为有AI之后围棋下得好就靠背谱,这是显然错误且很容易传播的具有误导性的观点。淘汰旧定式,学习AI新定式,也就是形成布局的新棋感,这只是棋手们在AI时代提高棋艺的第一步,或者说第一阶段而已。
在计算方面,AI的确帮不了我们太多忙,人类棋手的计算能力受限于人类大脑的容量和效能,或者说人的有限性,在不做脑机接口的情况下,人类下棋的计算能力整体上是没有多少提升空间的,个体差异则仍然存在且与AI无关。
问题的关键就是“判断”。实际上,在当年人机对决的过程中,我们就已经可以完全理解人类棋手和AI最大的差距就在“判断”领域(反而不是“计算”)。为什么是AI教我们下“点三三”,难道人类算不出点三三的基本变化?当然不是,而是对于地势转换的局面,人类棋手从前的判断是失准的。如果展开来讲,就是在地与势转换的时候,人类所使用的两种认知方法(“逻辑”与“经验”)所做出的判断的精确度差别较大,导致了判断失准(而地与地对决的时候判断就不会偏离太多,因为使用的是同一套判断的认知方法)。
围棋中的判断能力(对应AlphaGo的Value Network这部分),是人类可以通过向AI学习来提升的,这部分人类差AI很多,并且远没有达到人类能力的极限,因此有很大的提升空间。
AI的VN给出的是胜率,人类当然无法像AI那样直接将局面转化为胜率估值,因此人类还是需要用人类自身的认知方法来获得提升。人类的认知方法不外乎逻辑与经验,在棋感方面的提升,主要依靠的是经验的累积;而判断方面的提升,则是两者都有发挥作用的空间了。
人类棋手如今可以针对“判断”来进行专项训练,有AI这么好的辅助工具,这类训练应该成为最重要的日常训练方式之一。当然,由于一些高手的AI训练方法仍是保密的,具体怎么练,这里也不好谈论太多,只是有必要先从围棋的知识结构上把理论说清楚:为什么专门练习判断力是可行且高效的。
用AI来训练自己的局面判断能力,最简单的是用经验累积的方法,也是目前最容易制定的训练方案。未来可能出现的逻辑的方法,则将依托于新的思维概念,用通俗的话来说就是总结出更好的、更有效的棋理(淘汰掉以往一些错误或不精确的棋理观念),当然这大概不是短期能实现的。也就是从理论上来说,在目前的阶段,制订一些专门训练判断能力的训练方案,以累积局面判断的正确经验为主要目标,对于仍有志于一线的棋手而言,是十分重要且可行的。这方面,很可能申真谞已经走在了前面,大部分棋手们都还处在向AI学习的第一阶段:积累棋感(还有一些厌学的),而小申同学已经进入了高级班。
申真谞面对众多同样是在每天认真训练的高手,能够发挥出控盘流的优势,主要就是因为他的判断能力已经强出了至少一档,而在进入复杂战斗的局面时,他的胜率就会显著下降了(近年战胜过小申的棋手跟我说他的策略就是想方设法与小申战斗)。这里的原理如果用AI的胜率波动来说,所谓控盘流,就是使局面维持在有许多个选点出入不大、都能保持胜率领先的状态,此时的失误也不会突然导致败局;而所谓复杂战斗(或无论别的什么名字)的一个特点是,在计算分支较多的情况下,又要求几乎每一步棋都精确,一步失误就可能胜率跳崖。现代棋手们从小都是苦练计算的死活题大师,在计算力方面是很难有人超出别人太多的,因此战斗型棋手固然可能达到非常高的水准,但稳定度会低于控盘型,这是棋艺原理与人类的能力限度所决定的。当然换个角度来说,如果大家的判断能力都接近了,那么复杂战斗就成为了分胜负的主要方式(参考AI对决),此时所谓控盘型就不存在了,也就没有统治力极强的棋手了。
总结一下,申真谞现在超高的胜率依赖于他的控盘式下法,而这种下法之所以能获得巨大成功,是因为他的判断能力在众高手中显著领先(就像当年李昌镐一样,能在对手还觉得形势难分优劣的时候预判出某些变化图一方已经领先),判断能力的大幅提升使他避免了早期长时间处于战斗中容易被逆转突然崩溃的情况,而判断力的提升与使用AI训练的方法有非常大的关系。也就是说,目前要想击败小申,概率最高的方法是导入复杂战斗;而要想在棋力上追赶小申,就需要找到新的训练方法通过AI辅助来提升判断能力。
小申能通过AI学到更高的水平,或许在理论上不是完全自觉的,但与他对围棋AI的理解认知与感受,相信有很深的关联。
让我印象很深的是2021年申真谞接受采访谈论对围棋AI的看法,迄今我仍认为这是面对AI时代人类棋手最有意味的回应。
申真谞说:“Bluespot(蓝圈圈)是AI向人类推荐的,赢棋概率最高的一手棋。但是之上,分明有什么东西。”
“我最近终于领悟了胜负不是围棋的一切。现在我更注重一盘棋的过程。对局前我的状态是否足够集中于一盘棋?对局中我有没有下轻率的一手棋?局面有利时,我有没有自满?局面不利时,我有没有早早放弃了?出现了失误时,我有没有努力扳转局面?总之,我对围棋有了敬畏之心。”(参见访谈——申真谞:AI让人类跳出藩篱,追求更深奥的围棋艺术)
我将这段话放在武大围棋课第二学期第一节课的PPT上,用来展示一种人类对待AI的真正积极的态度(不只是围棋)。
AI所呈现出的“棋局的真实”,呼唤着棋手去不断找寻新的理解和语言,这种找寻需要谦卑的理智作为德性基础,而自大者将会陷入矛盾和茫然。到这里,棋与人的关系开始显露。
之所以说申真谞体现了“闇然而日章”的君子之道,一部分是因为他并非早早就锋芒毕露站在顶峰接受膜拜,而是经历了很长一段时期的低谷,甚至在艰难攀登和追赶的路途中被对手多次嘲讽,被命运之神的滑标捉弄到面壁落泪,被无端的污蔑气得睡不着觉,却始终保持了一名棋士的品格和气度,不得不还击时还能保持不卑不亢的腔调。从纯竞技的功利角度来说,小申最大的弱点或许是责任感太强,他显然不止肩负着取胜夺冠乃至打破纪录的责任,还肩负着维护棋士形象、为行业树立榜样的责任,这些责任感在比赛中有时会化为重担,使他难以在决赛中进入无我的澄明之境,又无法完全抛开所有责任感去只考虑赢这一件事。当然,农心杯上的传奇表现,证明如今申真谞已经能够完全担起这些责任,证明并非放弃责任才能没有负担地去赢。
那年小申被无端污蔑时,我过于生气,拉黑了一些跟风污蔑他的棋友,并通过韩国的朋友告诉小申,中国棋手里也有很多反对无端污蔑,维护棋士荣誉的朋友。这么做是不希望集体的公开沉默带来误解。之前韩国棋界的戴安娜事件,我通过金承俊老师向戴安娜女士表达了来自中国棋手的支持,也是出于同样的想法。出于各种各样的原因和理由,我们为公正所做的太少了,这对于被涂污的人们来说是很糟糕的,至少我们也应跟随内心去表达支持,即便与他们所受到的伤害相比是微不足道的。
2020年新冠疫情爆发时,家人在医院一线工作,我留在武汉遭遇封城,深感自身的无力无用,于是提议发起了围棋界对灾区的捐助,意外的是很快收到了来自韩国的捐赠请求,第一位提出捐赠武汉灾区的韩国棋手就是当时还不满二十岁的申真谞,后来又有李昌镐和崔精,他们每人捐出了1000万韩元来支援武汉抗疫(同时,捐赠在国内棋界也得到大量支持,但也引起了“拒绝道德绑架”的言论)。这让我想起2008年汶川大地震,李世石和赵汉乘在亚洲杯决赛前就共同决定捐出全部奖金,那届亚洲杯我输给赵汉乘半目,当时多么希望能和他们一起完成善举啊,在这样的时刻和事件中,我才能感到我们身处同一个行业共同体,而好的榜样对于更年轻的从业者们相当重要。棋手这个职业,本就不生产任何社会经济生活所需求的用品,却得到了不少物质奖励和一些社会关注,如果棋手们既不去探求人类精神与思维的界限,又不懂得回馈社会而只知无度索取,不屑于关注弱者而只知成王败寇,那么这个职业存在的合法性根基很快就会松动了。
好在有申真谞这样的棋手啊。无论是棋艺、对棋和AI的理解、对围棋的态度,还是棋品人品、对行业的认知与责任感、对棋道的传承,申真谞都堪为棋界表率,未满二十四岁的他已经渐渐展现出什么叫做“君子之道,闇然而日章”。