(ZT) 揭秘AlphaGo作者之一 Aja Huang 黄士傑(弈城账号 DeepMind)
作者:张晓茵 出处:新浪博客“晓茵的人生漫舞” (2016-02-08)
【我为什么支持AlphaGo 除夕有感】 (张晓茵)
首先,看到Google DeepMind的计算机围棋人工智能AlphaGo战胜樊麾二段的消息,的确有些意外,当然,也有一些恐惧。因为我知道樊麾的实力确实是职业棋手,而且是不会放水的,所以新闻一定是真的。
再来,看了各方围棋界大量的在讨论这则新闻,非常精彩!第一时间,我脑中立刻浮现出一个人:Aja Huang黄士傑。2007年我就读台湾师范大学研究所期间,召集师大对围棋有兴趣的学弟妹来创办围棋社,当时联系到了就读资讯工程研究所的Aja学长,他是业余6段,也是唯一一位在围棋社年纪比我大的学长,他很热心地来指导学弟妹,有关于围棋AI的知识都是那时听他说的。
那时围棋AI公认最强的程序是Zen,大约业余5段,而Aja学长所设计的程序Erica棋力也不俗,曾在荣获TAAI 2009年计算机围棋竞赛19路银牌及9路铜牌等佳绩。Aja学长的硕士跟博士论文都是在台湾师范大学资讯工程研究所林顺喜教授的指导下完成,分别是2003年的硕士论文《计算机围棋打劫的策略》(The Strategies for Ko Fight of Computer Go)和2011年的博士论文《应用于计算机围棋之蒙地卡罗树搜寻法的新启发式算法》(New Heuristics for Monte Carlo Tree Search Applied to the Game of Go),博士论文中Rémi Coulom为共同指导教授。
后排左一为Aja学长,照片为2007年台湾大专杯围棋赛师大围棋社合影
我在2007年时第一次听Aja学长介绍蒙地卡罗树搜寻法,我后来也上网查了一下,原理应该是:通过随机抽样的方法,以随机事件出现的频率估计其机率,或者以抽样的数字特征估算随机变量的数字特征,并将其作为问题的解。假设我们要计算一个不规则图形的面积,那么图形的不规则程度和分析性计算的复杂程度是成正比的。假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。藉助计算机程序可以生成大量均匀分布坐标点,然后统计出图形内的点数,通过它们占总点数的比例和坐标点生成范围的面积就可以求出图形面积。所以,Aja学长说他们每天都喂程序吃很多职业棋士的棋谱,那时我隐约觉得,只要程序吃的棋谱够多,一定能比人类还要强,没想到,这天来的这么快!
此外,这几年他们可能还加入了policy network及value network等关键技术。这次Nature杂志上关于AlphaGo的论文,有心的人应该会发现,第一作者是David Silver & Aja Huang.
(参见http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html)
看到Aja学长也是AlphaGo的研发团队之一,而且是并列第一作者,代表在团队中的贡献度不小,感到与有荣焉。我知道Aja学长博士毕业后到英国,2014年曾托我买了整套2013年《围棋天地》杂志合刊本,专门寄到英国给他。Aja学长为人低调,去年他加入DeepMind我也是最近才知道,而且在最近的报导中,他仍保持低调作风,一切贡献以团队为主,我在Facebook上想跟他多了解一些AlphaGo的讯息,他说是整个团队的贡献,而且很多事情目前都需要保密,等到三月跟李世石九段比赛后之后才能说。
关于最近有网友发现在弈城上有一个deepmind的账号,揣测是否就是用来测试AlphaGo程序的账号。1月29日,在台湾的书呆弈讨论区中,Aja学长已正式回应,那个账号是他个人在使用的。原文如下:
「奕城的deepmind是我本人(Aja Huang)在用的账号,并不是AlphaGo,而且deepmind应该是在14年底之前、在AlphaGo团队出现之前就创建了。如果我记得没错,我是在Google收购DeepMind之前就在奕城用deepmind下棋了,那时候我打到奕城8d。我本人喜欢下围棋,棋力是台湾业余六段,去年在德国的比赛我甚至赢过一位日本职业棋手。但AlphaGo肯定是比我强太多了。」
「职业水平的围棋软件,应该最慢在1-2年之内就会在市面上普及。我相信Zen的作者目前正在全力实作我们公布在<自然>杂志上的方法,或许Zen可以在不久的将来追上AlphaGo,我个人十分乐见这样的发展。我估评7d的Zen目前距离5个月前的AlphaGo还有3子以上的差距。」
(来源:http://www.yigo.org/modules/newbb/viewtopic.php?topic_id=9845&viewmode=flat&order=ASC&type=&mode=0&start=20)
依照Aja学长这样的回复,AlphaGo的真正实力应该有职业水平,不容小觑。加上Google肯定是有一定的把握,从去年开始经过缜密的筹备及酝酿,直到今年初公开消息,是有完整准备的。当亚洲围棋强国在为梦百合世界大赛冠军争夺时,英国的DeepMind团队已悄然走在超越人类世界冠军的道路上。
三月对战李世石,AlphaGo研发团队坚持不透漏各种保密协议的内容,这使我更看好AlphaGo。我不是不支持人类,而是除了棋手个人的棋力强之外,我更相信人类集体智慧的结晶成果,即Google DeepMind团队合作的智慧。
这里我想说一个题外话,可能不是很重要,但是或许也可以从侧面多了解一点线索。一般人会觉得计算机工程师一定是整天面对着计算机和大量的数据,思考必须非常理性。能够开发出打败人类的围棋程序,研发者的思维一定非常严谨,做事一板一眼。但是接触了Aja学长,发现并不是这么回事。他们也是人,而且,Aja学长还很喜欢音乐,甚至自己能够用MIDI作曲并弹奏。我自己从小一直是学音乐的,听到Aja学长的作品都觉得有专业水平,而且非常感性,我今天翻出来听都还是耐人寻味。
我在想,这样一位理性感性兼备的计算机工程师所在的团队,其开发出来的计算机程序,或许会想过把一些人性的元素放进去。
很高兴,Google团队里有这么一位台湾人,Aja学长说要低调,因为AlphaGo的团队成员很多,不是他一个人做出来的。但是,为什么我们不能说,AlphaGo的团队成员很多,但是其中有一位台湾人,而且拥有业余6段的棋力也是团队中棋力最高的,可谓「台湾之光」!身为师大校友、台湾人,甚至亚洲人,Aja Huang能在英国的团队中贡献所学,都应该为之喝采。此时,是否我们可以用一种更宽大的胸怀,这群研发团队代表人类突破了围棋人工智能,大家应该共同身为如此神奇的人类而讚叹。就算AlphaGo至今尚未打败人类世界冠军,但我相信这一天并不会太久,我乐见其成。