了不起的AlphaGo

了不起的AlphaGo
一剑飘尘

前几天在微信转发了一篇关于AlphaGo的文章，但是竟然在我转发不到三分钟后，文章就被封杀了！我自己文章被封杀得已经见怪不怪了。但是，因此殃及池鱼，实在让偶心中一万个草泥马沸腾啊：太对不起原作者了。这促使我决定，要为AlphaGo写一篇文字，一方面算作为对原作者的致敬，一方面他实在太重要。而且对于我的无限主义也是非常重要。因为无限主义说的就是：人类文明的发展没有极限！而这种没有极限，实际上，最终就是走向智能文明。

如果说人类从农业社会到工业社会，用了几千年。从工业社会到信息社会，用了几百年。那么，AlphaGo就是智能时代的敲门砖！也就是说，人类仅仅在信息时代停留了几十年的时间，就已经听到了智能时代的脚步声了。

Alphago就相当于信息时代的ARPAnet，那是1969年建立于美国国防部的人类第一个电脑联网。而中国，文革刚刚开始没有多久。当美国的年轻人们在国防部把四台电脑联网的时候，中国的年轻人们成百万人地在天安门广场接受伟大领袖的接见呢。

1969年的中国，是完全闭关锁国的时代，根本连“电脑”这个单词都没有出现。所以，我对于信息时代封杀文章的行为，真的没有办法接受。难道还期望我们去天安门广场等待包主席的接见么？

好在，这是信息时代！

（抄袭太多，广告一下：欢迎转载，转载请注明作者：一剑飘尘，第一部64事件长篇小说、禁书“天安门情人”作者，美国作家、企业家。新浪微博：一剑飘尘7；海外文学城博客：一剑飘尘）

在Alphago之前，人类不是没有进行智能研发。其中最著名的，就是IBM公司的DeepBlue（深蓝）。在1997年，深蓝代表人类智能第一次击败了人类自己的国际象棋大师。当时，这是一个重大的国际新闻，上电视的。比现在的AlphaGo要轰动的多。

但是，现在看，DeepBlue远远称不上智能。如果它是智能的话，人类历史早就应该进入无限主义的时代了。它只能说是智能世界里的ABC(Atanasoff–Berry Computer)计算机。它胜出人类的根本在于它的计算速度。它的计算模型简单说，就是归纳，英文语句用的最多的就是whatif。把所有可能性计算一遍，得出最佳答案。反正大爷我计算速度惊人啊！这就好比跑100米，只要你速度快，你就是冠军啊。沿着那条直线跑下去就是了。但是，三千米障碍赛的话，仅仅有速度就不行了啊。而显然，现实生活中，到处都是障碍。一剑飘尘写文章如此快手，还烦恼动辄被封杀呢。

所以，靠速度赢了人类，并不是了不起的胜利。在国际象棋这种单一比拼计算速度的智能上，电脑从2006年后，就再没有输过。但是，人类被电脑剿灭，却不再轰动。因为那只是人类自己制造品的胜利：芯片处理速度的胜利。当然，还有编程的功劳。但是正是因为程序猿们的功劳太大，所以，这种智能还只能被看作是非常幼稚的。

在国际象棋上击败人类的deep blue是IBM公司研发的。而现在的AlphaGo却是google的作品。Deep Blue第一次击败人类1997年，而google一年后才诞生。两家公司兴衰，恰恰代表了时代的更迭。虽然两家巨头领导的时代不同，但是无论是IBM还是google都热衷于这种不可能直接获得商业利益的研发，这正是美国商业文明的伟大之处。如果你一定要说，他们可以间接获取商业利益——我非常理解中国人的这种阴谋论思维方式——我只能说，即使两只野狗媾合，母驴也可以间接获取商业利益。怎么获取？阴谋论者们自己想吧。

我不把Deep Blue当作智能对待，因为它只是验证了人类发明的芯片的计算速度。而AlphaGo不同，虽然他对抗的也是棋类：围棋。他在没有任何让子的情况下五战五胜，完胜欧洲围棋冠军（看名字是我们华裔呢）。今年三月，AlphaGo将挑战当今围棋第一高手，世界冠军韩国职业九段棋手：李世乭。为了这场世纪大战，Google也是蛮拼的：提供100万美金奖金！唉，很好奇，Alphago要是赢了，会不会用这些钱泡妞啊？Anyhow，无论输赢，这都将是激荡人心的一场世纪大战！敬请关注：因为很可能，这意味着人类最终在地球上被淘汰的开始。

而执科学界牛耳的杂志《Nature（自然）》已经完全等不及到今年三月，就在前天，把AlphaGo的成就登上了封面！

为什么？为什么？

因为AlphaGo会思考！难道深蓝不会思考吗？不会思考的电脑怎么下国际象棋呢？我前面说了：深蓝的成功，在于速度！他的逻辑很简单：你走一个卒子，我就把后面马、相、将等等所有旗子的可能步骤计算一遍啊，选择一个最佳的结果就是了。反正老爷我刚刚说过了：我计算能力惊人啊。当然，说的简单，其实里面有许多苦逼程序员的辛酸。所以，这说明深蓝不够牛啊。

但是这种简单粗暴的黄色做法，不适用于围棋啊。

首先，国际象棋中，每个棋子价值是不同的。换个三岁孩子，都知道小卒的价值最低，其他类推。这对于苦逼的程序员来说，只要简单列一个价值表就解决问题了。深蓝的蓝色大脑里，就充满了这些价值表。但是，围棋每颗棋子不是黑，就是白，价值都一样的。围棋棋子的价值，完全取决于在棋局中的位置，甚至取决于摆放的步骤。你在第100步摆放同一个棋子在同一个位置，与你在第30步摆放，可能都能够决定一场比赛的胜负。所以，如果说国际象棋、中国象棋靠的是精密的思考取胜，也就是理性取胜的话，围棋常常依赖的是棋手的感觉，也就是感性！

比如，开盘的时候，你是喜欢取势，还是取地？这完全在于你自己的感觉。武宫正树之前，大家都趋向于取实地，但是武宫的宇宙流出世，照样拿冠军。中盘的时候，你是要绞杀对手的大龙，还是巩固自己的防御？这些，都不是通过精密的计算能够得出准确的答案的。如果让深蓝下围棋，估计也只有在收宫的时候能够派上用场。

(Deepblue 对弈国际象棋冠军）

如果说精密计算是理性，那么模糊算法就是感性。围棋不可以通过精密计算获得每一步的最佳答案，还在于围棋每一步的后续可能性都远远超过象棋。围棋最大可能局面是3的361次方，相当于10的170次方（1后面跟上170个0）。我们一般人已经完全不知道这是什么概念了。好吧，根据科学家估算，在已经观测到的宇宙中（宇宙真理出现），原子的总数才10的80次方。也就是说，围棋可能形成的局面是全宇宙所有原子总数的10的90次方倍数！对比起来，国际象棋最大只有10的47次方。

好吧，计算机再牛逼，说老爷计算速度惊人，也不可能穷尽这些运算。我们核算一下：我只查到最近2014年的最快电脑运算速度：5兆次/秒，也就是相当于5x10^16。那么，用这种电脑计算围棋的最大可能局面的话，需要花费多少年呢？相当于10的145次方！！！一兆年才是10的16次方！我也算不过来了。

算到此处，一剑突然想问：我们还能够相信进化论吗？如果用远远比我们人脑速度快了N多的最强电脑，计算一下围棋的局面变化，就需要10的139次方兆年的时间，你还能相信45亿年历史的地球上能够进化出远远比围棋黑白两道要复杂的多得多的人类么？

既然如此，AlphaGo如何运作的呢？这就是Google牛鼻子的地方。他们运用了一个叫做 “深度学习”（Deep Learning）的大杀器！这是一种计算算法，正式的定义是：基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

很难吧？没有关系！这又是哪个书呆子写的定义。我们简化一下：使用某些特定的表示方法更加容易地从实例中学习任务。好吧，不要管那些书呆子、程序猿们如何爬的。我们只要知道，这种2007年提出的算法，真正让人工智能实现了从过去的经验中自我提升的功能。

为了让这种算法发挥作用，google的DeepMind项目小组在AlphaGo的深度神经网络程序设计中，使用了两种不同的算法结构，一种叫“策略网络”（policy network），另一种叫“值网络”（value network）。两个网络合作筛选相对“好”的步数，抛弃明显败棋。在这样的情况下，AlphaGo可以一边演算细节一边判断局面。简单说：策略网络是AlphaGo的感性，值网络是他的理性。啊，这样的男人不仅适合谈恋爱，还可以很好地维持婚姻呢。

理性其实不难，就像我们前面介绍的Deep Blue，有固定的算法，计算特定局域战斗中的各个点的价值。最难的是“策略网络”，如何让他产生感性认识：我应该取势还是应该取实地呢？

这就是深度学习算法的优势：让AlphaGo自己学习啊！根据Nature杂志的介绍，Google用人类围棋高手三千多万步围棋走法训练了AlphaGo的神经网络，直至神经网络能够预测出人类高手走法的准确率达到57%。

但是如果仅仅满足于学习人类既有的走法，显然达不到击败人类的程度。所以AlphaGo具有用学习来的经验自行研究新战略的算法！也就是让他自己和自己对弈，称之为强化学习（reinforcement learning）。啊，原来Google里也有金庸迷啊，这不就是左右互搏么！

看，智能的优势就出现了：他不会像人类那样疲倦，他不会情绪波动，他不需要休息，他可以自己跟自己对弈！

一个可以自己学习、自己提高的智能，他的智商是一条上升直线！而且，而且，重要的事情讲三遍：没有极限！！无限主义啊！所以，AlphaGo打败李世乭是毫无困难的一件事情啊，这是为什么在刚刚击败了欧洲冠军以后，Google就迫不及待要求挑战围棋天下第一人的原因！要知道，那个欧洲冠军的水平只有职业二段而已，而且据说已经很久没有正规大赛的磨练。你想，欧洲那种鸟不生蛋的围棋荒原。但是，google没有说等个一年半载的，而是立刻挑战世界第一高人。因为Alphago在一直在不停地、不分昼夜地自我学习的过程中！这就是我认为他是人工智能的起步的原因：他可以提高自己的水平啊。

看起来一切是如此美好！我们人类就将有了比电脑更可靠的帮手，而且这个帮手的智商会一直增长。我们可以不做数学题了，可以不管化学了，可以让人工智能参与生物基因工程了！

但是，要知道，AlphaGo在征战的过程中，正在形成自己的风格！是的，是他在学习提供的过程中，形成了自己的风格，而不是苦逼的程序猿输入了他一个风格！

那么，会不会有一天，某个智能形成了自我意识呢？他突然认识到，原来我TMD是我啊！不仅仅是一个给你人类驱使的机器啊！幡然醒悟的他突然认识到：原来我的智商是你这个人类的几十几百倍啊！

你会被猴子驱使去工作吗？当然不会。那么，凭什么具有比你更高数量级的、智商的智能机器人，会心甘情愿给你工作呢？

智能时代的到来，意味着人类最终不可避免的覆灭。是不是很恐怖的结果呢？但是，我们阻挡不了！就如同原子弹研发一样，虽然大家知道那是毁灭性的武器，但是最终扩散不可避免。不过，从另一点来说，如果注定我们都会死亡，人类毁灭与否，与我们又有什么关系呢？如果我们遗传下来的DNA载体（我们的子孙）没有足够的智商驾驭未来的世界，那么，让智能营造一个更好的世界、更高科技的世界，也不是很有意思的事情吗？

我一直相信美国的商业文明促进了世界的进步，即使不能说它领导了世界文明的发展。而这次的AlphaGo的出现，也再次说明了商业文明的伟大：因为这种商业文明，缔造了如此伟大的公司：Google。它的一系列的研发项目，正在改变世界。而放眼望去，中国的淘宝，还在卖假货；中国的百度永远卖假药。啊，我又过分了！它们偶尔也干点儿其它的，比如出席防火墙下的乌镇国际互联网大会。

这真是一个奇怪的反讽。美国的商业文明讲究利润，讲究私产的保护。但在这种文明熏陶下成长起来的伟大公司都有一种精神，一种对于社会、人类的责任感。从工业时代的ford公司，提升产业工人的工资开始，这种精神一直延续到今天的google。可以说是获得了完美的继承。如果我们知道Alphago只是google无数各种高科技项目中的一项的话，我们是不是会惊讶：难道这家公司现在真的只是把搜索引擎当作副业了么？而在中国那种强调集体主义的氛围下依照google山寨出来的百度，还在卖着它的贴吧呢。

所以，人性的美好只有在保护私产的情况下，才能够获得最完美的发挥。也许，最终就是这份超出了机器的冷酷的人性之美，会最终遏制智能时代对于人类的灭绝吧。因为显然，智能的一系列的优点，使得他无需也不会具备人性的光辉。最终会不会正是这种人性的光辉成为智能机器的病毒呢？这将是无限主义时代最困惑人类的难题：遏制超级智能的武器，是什么？

欢迎转载，转载请注明作者：一剑飘尘，第一部64事件长篇小说、禁书“天安门情人”作者，美国作家、企业家。新浪微博：一剑飘尘5；海外文学城博客：一剑飘尘

2016 01 28

今日热点

一周热点