棋类运动,甚至人类历史上,发生过无数次,弱小一方对面优势大到不可能输的一方,却发生了绝地大翻盘的事情。抛去东方神秘力量之类的因素,这种事情一般只有三种可能:
一、弱势一方运气逆天;
二、所谓的优势其实是幻觉,是误判;
三、优势方犯了巨大错误。大多数棋类运动,包括围棋,不存在运气问题,所以第一条我们先不考虑。李世石对AlphaGo的第一场其实就是第二种情况。下到中盘的时候,我看的直播说只要李世石不犯错,基本就不会输了。下完后的复盘结论是,当时优势其实在AlphaGo一边。这就引出一个很严肃的结论:人类的判断可能跟真实局势相差甚远。如果绝顶聪明的电脑能判断出真实局势,那么它眼中的局势很可能跟你看到的完全不一样。这局势有多不一样?很可能人觉得自己占据优势的时候,绝顶聪明的电脑觉得人已经输了。如果此时换成两个人来接着下棋,还能下得有来有回,但在绝顶聪明的电脑眼里,这不过是菜鸡互啄罢了。我举一个星际中的例子:星际2 超级AI梦幻级微操 小狗冲坦克阵100条狗冲20个架好的坦克阵,谁会赢?如果是人来打,坦克大比分赢;换成电脑,小狗大比分赢。人会觉得坦克优势无限大,但如果双方都完美操作的话,坦克一点机会都没有。那么优势方犯错呢?当然,绝顶聪明的电脑应该不会犯错。AlphaGo不是绝顶聪明,第四盘它犯错了。当然它也算非常聪明了,很快它就意识到自己劣势了,之后它怎么下的?它在乱下。为什么?因为它的学习过程里包含大量自己和自己对弈的过程,所以它默认它是在和另一个接近绝顶聪明的对手下棋。绝顶聪明的对手不会犯错的;绝顶聪明的棋手不会挖坑给对面,因为他知道绝顶聪明的对手不会往下跳。所以乱下并无所谓,反正无论怎么走都是挣扎;只要对面不犯错,自己怎么走都是输了。。所以这里有个思考题:如果有一步棋,你这么下了,对面只要应对正确,就必赢。但是对面中间随便一步出现最微小的偏差,你就立刻赢了。那么,你会不会这么下?或者简单的来说,你会不会卖个破绽给对面?反正绝顶聪明的电脑不会。关羽使拖刀计阵斩了不少对手,不过如果是绝顶聪明的电脑来的话,它会直接从上去把武圣砍了。绝顶聪明的电脑就是这么无趣。
如果真的是聪明绝顶的电脑,那情况只会是以下三者之一:电脑1开局求和,电脑2接受(和)电脑1开局认输,电脑2接受(先手输)电脑1开局下了一步,电脑2认输,电脑1接受(先手赢)
博弈论里面一个经典结论,有限步后中止的信息完全公开的游戏,要么先手或者后手一方有必胜策论,要么双方均有不败策论。证明用一点点归纳法就够了,这种游戏可以看作一个分叉树,对树的长度进行归纳。证明非常容易也在其他答案中有人给出来了,有兴趣可以去看看。其实不那么追求严谨,直观来说这两种结论几乎显然互为否命题…先手也不能必胜后手也不能必胜,那就是说先手也不是必败后手也不是必败,你很难再想一种其他情况出来。(当然这不能作为证明)然后回到题主的问题上,围棋象棋这类游戏其实都是有必胜策论或者不败策论的(是不是特别毁三观)。所以如果电脑足够聪明,或者极端点电脑里头存有所有可能性的棋谱,或者说直接是上帝本人来下棋,那两边都不失误的情况下必然有一边必胜或者双方都不败。这是由游戏本身决定的。剩下只需要聊聊这些棋类为什么有限步后中止。虽然围棋象棋我不是很懂规则,但是我觉得有充分理由相信这些棋类游戏都是会在有限步之后结束。比如我听说象棋比赛里好像多少步不吃子就算和棋?欢迎纠正。当然上面那一段不是特别重要,因为棋盘有限大,一般来说棋类游戏只可能出现有限种状态,换句话说你不停下下去必然会出现回棋,这时候可以根据一些额外的讨论强制判和或者一方负。Anyway,细节怎么去操作不是特别重要,但是肯定是可行的。
首先,作为绝顶聪明的电脑,不会仅仅按照所谓最优策略去下棋,而是会估计对手的棋力来下棋从而赢的最多。所以在不知道对方也是牛逼电脑的情况下,不可能直接求和,或者主动认输。而是会不断的下棋,估计棋力,调整策略再下。所以如果连续下很多盘,而且他们知道对手不变的话,他们每盘的策略都会不同,甚至可能故意不下最优解以期找到对方的思维漏洞。可能我跟大多数人理解的绝顶聪明不一样,很多人觉得解开了游戏,知道最优策略就是绝顶聪明了,而我觉得这还算不上绝顶聪明。绝顶聪明的电脑要探究对手的心理,对手的水平,甚至知道对手是否也是绝顶聪明的电脑。在一个先手必输的游戏中,如果面对菜鸟也直接认输,实在算不上绝顶聪明。





