皮皮虾:【热烈欢呼人类的伟大失败】

你一定猜出来了，我所说的人类的伟大失败是指昨天谷歌开发的阿尔法围棋(AlphaGo)赢了韩国天才李世石一事。

或曰：这只是第一盘，还有四盘呢？虾答：对！但李世石可能没机会了(如果这盘棋李世石是正常发挥的话)。你知道吗，AlphaGo这玩意儿是个不分昼夜每时每刻都在学习的家伙，经过这场比赛，他明天的棋力又长了一大截！今年一月，科技界最权威的《自然》杂志在封面发布了一个消息：去年十月AlphaGo这怪物以５:０大胜欧洲冠军、职业二段樊麾，杂志内文又有论文详细介绍。因为樊多年不在围棋中心地中日韩参与一线赛事，许多人断言它的水平与李世石差远了，要被让二子至少让先才行呢。

现在傻眼了吧？昨天这盘棋之前，最乐观的挺机者也只是认为机器会赢两盘，而且是最后两盘。一向牛逼哄哄的李世石也自认百分之百的机率获胜，很可能是5:0，好象这100万美元的奖金就是为他设的。太低估学霸了！好吧，让我们试目以待，如果第二盘再赢，证明李世石输棋不是失常偶然，我们就等着唱人类的挽歌吧！著名九段江铸久说：AlphaGo是个“遇强愈强”的主，“只要电脑赢一盘，电脑超过人类的时间点就已经到了。”现在人类历史已到了这个拐点，就等着求导数了！

又或曰：李世石不是人类的最佳代表。最近风头最劲、连拿三个世界冠军的柯洁就说自己想上了。且慢，人家李世石虽然已过了巅峰期，毕竟十四个世界冠军在手，柯洁还是应该再多拿几个才有说服力。

拿世界冠军最多、开创一个时代的李昌镐(个人18冠、团体13冠)是比李世石更牛的天才，被公认为世界第一人，当年擂台赛十四连胜，超过了早前聂卫平举国若狂的十一连胜，被称作铁门。对计算机颇有研究的中国围棋队俞斌总教头曾精确计算过李昌镐的水平，认为是达到了十四段的恐怖高度！可惜他的时代已然结束了。

有人把李昌镐与吴清源相提并论，其实吴可能是个更厉害的角色，当年把全日本所有的高手打得吐血，让先让子，满地找牙。他可能是人机大战的最佳人选，可惜在上世纪三十年代科技还未发达。

不过吴清源的关门弟子、女中豪杰芮乃伟倒不失为一个可能的人选，毕竟女性思维很不一样，说不定AlphaGo不太适应呢。刚才说到的江铸久就是她的丈夫。江铸久的哥哥江鸣久九段现居硅谷，还给小孩讲棋(硅谷的孩子多有福)，据说他被谷歌AlphaGo设计团队咨询过。

当年女中豪杰芮乃伟在李昌镐最牛且打败天下无敌手的时候，连续三次干掉了他，拿下韩国的大国手战的桂冠，大概芮的女性思维石佛不太习惯。芮后来在1990年杀入号称围棋奥运赛的应氏杯四强中。国际象棋界的女神外星人小波尔加厉害吧？在男女混合排名中，她曾排名世界第八。可是棋后谢军认为，某种意义上，芮乃伟更了不起！

对不起，此图黑白颠倒就好了！

吴清源在日本为中国人争了气，那时中国围棋全面落后于日本。小日本学东西快，他们唐朝时从中国引入了围棋，就一个猛子扎进去了。唐时日本王子来华，与当朝第一高手顾师言对弈，败下阵来。他不知这是首席，要求对阵第一高手，被拒绝，理由是打不过顾师言，不能见更高层次。王子心中很失落。这大概是有史记载的最早一次中日擂台赛吧。本虾记得是在初二的寒假读邓拓的《燕山夜话》时知道这段秩事的。当时去校长家拜年，被问起正在读什么书，本虾就说起来。老校长笑曰，文革就是从批判这本书开始的。时过境迁，往事历历在目，已经几十年光阴了！

又又或曰：为什么欢呼人类失败？虾应：这标志着人类进入了一个新时代。自从瓦特发明蒸汽机使人类进入工业革命从后，人类不断跨入新时代，而且周期越来越短，简直是加速度。机械化代替人的体力后，人类先后经过电气革命、微电子革命(电脑代替人脑的部分功能)，刚在信息时代还没坐稳屁股(只是硅谷称得上完全进入信息时代)，人类现在已经踏进智能时代的门坎了！这场人工智能的革命给世界带来的影响和冲击将远远超过前几次革命的总和，人类的生存方式将被彻底改变，人类将进入以前科幻小说所预言的恐怖的＂后人类时代＂。

知道你会问这次这个电脑怎么这么牛。不同于1997年战胜国际象棋世界冠军卡斯帕罗夫的深蓝(Deep Blue)，这次这个AlphaGo 可是个厉害角色！它可以模仿人脑的思维，而且具有学习能力！谷歌显然不同于IBM，它们正好是两个时代的标志。

按理对于围棋这种目前世界上难度最大的智力游戏，电脑应该是束手无策的。国际象棋因为每个棋子的等级不一样，电脑很容易通过计算求得最佳下法。围棋的绝妙在于，只有黑白两种每子完全平等的棋子，每个子的威力全在于落子的位置、它与周围棋子的关系、甚至是落子的前后顺序，其复杂性玄妙性比天上的星星还繁密。所以这种棋不但要求逻辑思维超高(这点电脑在行)，而且要求一流的直觉和感性，简直是艺术了(这点电脑怎么学？)。

可是谷歌就迎难而上敢于挑战难度。其实这之前，脸书也做了尝试，《自然》杂志发表论文后，小扎还在脸书上正名说他们先走一步的，这还是女儿告诉我的，她整天都跟踪这些大V的观点动向。

据说谷歌的DeepMind项目小组在设计AlphaGo的深度神经网络程序时使用了两大杀器，一个叫“策略网络”(policy network)，管具体走子(胸有十万棋谱的大数据)，另一个叫“价值网络”(value network)，可以评估局面。两大杀器携手合作，筛选最佳走法，一边演算细节一边判断局面，既有IQ又有EQ，简直帅呆了！本虾好友一剑在几天前的文章里很形象地把这种自己和自己对弈的强化学习功能(reinforcement learning)比喻为会左右互博的武林高手。知道是金庸小说中的哪位大侠吗？

记得十多年前本虾与一位留美的前北大美学教授谈起武宫正树的宇宙流，讲到武宫的观点是，最美的格局应该是最佳的走法因而应该最终赢棋。如果没赢，那是因为你走得还不够美，没有达到最高境界。武宫本人就常常为了美、为了某种对称宁可输棋也要那样走。武宫的理论让这位朋友叹为观止。现在好了，有了AlphaGo，我们可以期待它能整出最美的流芳百世的棋局了，一定很有美学价值。

这一次革命不同于老校长所说的文化革命，是真正颠覆性的。也许对人类来说是个灾难也未必？

管它呢，先欢呼了再说。

****** 编后语 *******

欢迎转发，欢迎提问或评论。请关注公众号。

打开手机微信，点击右上角加号，选择“扫一扫”(Scan QR Code)，扫描图中二维码，选择进入(Enter official account)即可。

皮皮虾:【热烈欢呼人类的伟大失败】

今日热点

一周热点