人类史上最重要的一次智力对抗

人生到处知何似,应是飞鸿踏雪泥,泥上偶然留指爪,鸿飞那复计东西。
打印 被阅读次数

前几天看到Google研发的AI人工智能“阿尔法围棋”(AlphaGo)以5:0的绝对优势打败欧洲的围棋职业冠军——来至中国的围棋二段樊麾。一时之间震惊不已,在收看了新浪围棋的多项电视品论之后,对整个事件有了一个比较全面的了解。

据悉,在三月份AlphaGo将和韩国九段棋手李世乭在首尔一战,奖金是由Google提供的100万美金。李世石是何许人?爱下棋的人个个对这个名字如雷贯耳,就像是当年深蓝对抗的卡什帕罗夫一样的顶尖棋手,在上个十年间获得最多世界冠军头衔的天王。多说一句,李世石在去年和中国顶尖棋手古力的十番棋对抗中,居然将同岁的中国顶尖棋手,打到降级的地步。

十几年前的电脑深蓝,击败了人类的顶尖棋手卡斯帕罗夫。预示在国际象棋领域,电脑已经完胜人脑。当西方媒体哀鸿一片之时,作为一个中国人引以为傲的是,在围棋领域,这个有着两千年历史的古老东方智力游戏,电脑还是完全无法对抗人脑。

作为一个有三十年爱好的资深棋迷,我对于历年研发的围棋软件,经常下载和电脑下棋。早年的电脑就连我这样的业余棋手(在弈城达到过四段,稳定在三段),也能让四子以上。去年在网上下载了天顶围棋,号称当今最强的围棋软件。我至今和天顶下过约二十余盘棋,在设定最强棋力的情况下,我还是赢过两盘,基本上天顶比我稍强到让先倒贴目的状态。所以新浪围棋直播中罗洗河九段在让天顶六子的情况下,可以狂虐电脑。

在此之前,我一直认为,电脑要在围棋领域战胜人脑,大约还要有十至二十年时间。现在看来我还是大大低估了科技的发展。有人要问,为什麽深蓝十几年前就可以打败人类,而十几年的电脑科技发展,如今电脑却还不能在围棋上打败人脑呢?

国际象棋的状态复杂度是 2^64 次方,而围棋则达到 2^128 次方,网上有很专业的评述介绍,我就不要重复了。做个不太准确但形象的比喻,我时常对儿子聊天,讲到国象和围棋的难度差异,就像跳棋和国象的差异一样。从变化莫测的广度深度来讲,假如围棋是太平洋,国际象棋大约是个游泳池吧。

 

国际象棋高手之间时常会以平局告终,应为某一种开局之后的优劣变化,双方都已经是了如指掌,谁也不愿意去改变。而围棋号称千古无同局,许多局部定式至今尚未了解清楚,许多定式的优劣判断,多年以后随着棋风思维的改变,又会重新定义,更不要讲全局的判断了。

 

围棋中有许多比较虚的地方,作为人类思维,很容易去理解,但是作为电脑,却很难用数字之类的去衡量判断。比方厚和薄,虚和实,弃子转换,打劫等等,这是人类思维比较高级的地方,也是AI人工智能挑战人类最感困难的地方。

AlphaGo似乎在这些地方都有突破。

AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

这样的思维就是接近人脑的判断了。

第二种是学习。

日本著名棋手到了晚年,时常会纪念一下胜局达到1000局的记录,加上失败的局数,往往一生有接近两千局棋的经历。比方中国的古力九段就刚刚达到一千局胜局的记录。每一盘棋局都是一次学习的经历。早年间中日本棋手有过一段对话,好像是刘小光问小林觉吧:每年对局数是多少?小林觉说一线棋手大约是8-90局,普通棋手大约是4-50盘棋比赛。刘当时很感慨,中国棋手加上升段赛,一年才十几盘棋。

而AlphaGo每天可以自我对弈达100万盘棋,从自我对局中学习提高。从现在到与李世石比赛,大约有三十天。AlphaGo还可以有3000万盘棋来提高学习。这是一个多么惊人的情景。用一日千里来形容AlphaGo的进步一点都不为过。

所以每个评论的棋手都认为,AlphaGo在和樊麾对局时展现的实力,完全不等于几个月后和李世石对局时的棋力。

有些人认为樊麾才是个职业二段,哪能和顶尖的李世石相比,更有人认为年初中国的柯洁战胜了李天王,柯洁才能是对抗AlphaGo的代表。

其实达到职业棋手,相互间的棋力相差是很小的,能够战胜职业二段,战胜李世石就绝不是一个不可逾越的鸿沟。

AlphaGo战胜樊麾二段的五局棋,除了第一盘是谨慎的细棋之外,后面几盘樊麾都是脆败,毫无还手之力。其中印象很深的是第二盘,樊麾想将局面弄得复杂一些,走出一个比较难测的变化,结果被电脑抓住了误算,中盘崩溃。

基本上樊麾在第三局之后,就是处于一种置之死地而不胜的状态。

以我对电脑下棋的经验来讲,电脑是不会恐惧、犹豫、胆怯、激动、后悔、生气等等棋手常见情绪来干扰对局,不会疲劳不会遗忘,永远冷静判断。电脑下的每一步棋都会牢牢地记住,绝不会因为时间长而忘掉定式的某一个变化。在局部的死活上绝不会误算,想通过战胜人类的某些方式,在面对电脑时是无效的。而当人类发生某个失误时,电脑绝对会抓住不放的。这是电脑最强的地方。

李世石的棋风号称僵尸流,将某块死棋保留有种种余味,后盘通过劫争、转换等方式起死回生。中日韩三国棋手对此都深怀惧意,由此产生极大的心理压力,因为李世石在算路和判断上极其精准。从而在许多大赛中,原本无理过分的行棋,因为对手在心理上产生的压力,影响了判断,让李世石在很多次对抗中绝地反击转败为胜。但在电脑的算路面前,这样的棋就没有什麽压力威胁可言,反而是一个可能脆败的弱点。

从心情上讲,我希望李世石此次能够维护人类最后的光荣。但是实际上AI打败人脑已经是早晚无疑的事了。

李世石要赢这一百万美元,不容易吧。

急切的期盼五番棋的到来,从人类的长河中,人类最优秀的选手,在最复杂的游戏中,首次对抗机器的挑战。

 

登录后才可评论.