找回密码
 立即注册
查看: 598|回复: 0

谷歌围棋软件挑战人类

[复制链接]

自攻螺丝

发表于 2016-3-7 14:11 | 显示全部楼层 |阅读模式
     《自然》,就是英国著名的那本《Nature》,它应该是人类科学自然科学杂志里的头一号,创刊时间是1869年,是个老爷爷一样的杂志。今天咱们读的是2016年1月28号出刊的这本。封面故事是《电脑人工智能战胜人类围棋职业高手》。

      人工智能啊,我们每个人好像都能听见它越来越接近的脚步声了,这次它又狠狠地向前迈了一大步。围棋是人类发明的最复杂的棋类游戏,这个没有之一,最复杂。在此之前,人类高手对电脑那是绝对优势,也帮我们人类守着这块尊严和阵地吧。但是就在最近,这个阵地塌了一个角,到底发生了什么?背后有什么故事?而且围棋领域的人机大战,一场终级决战将会在2016年3月8号上演,你想知道这次对决的双方是谁吗?听完这期音频你就都知道了。

     《自然》杂志的原文上来是从一件过去的事说起,1997年一个名叫“深蓝”的电脑第一次战胜了俄罗斯的国际象棋高手,震惊了世界。9年之后,也就是2006年,国际象棋的人类高手最后一次战胜电脑,之后就下不过了,等于说从第一次战胜到完全超过人类,电脑用了九年,而且和电脑对抗智力,你这个阵地一旦一丢,将来好像再也没有夺回来的可能了。

      但是围棋电脑一直下不过人类,主要有两个原因,一个原因是计算量太大,还有一个,围棋很多时候它的招数是比较抽象的,要理解这两点的意思,需要大致知道一下围棋的玩法。

      在《自然》的官网上,给这篇文章配了一个视频,里面用最短的语言介绍了围棋的玩法,围棋就是一张19×19格子的棋盘,19×19就得到的361个点,那么黑棋和白棋轮流往这些点上放子,这个子放上去就不能动了,看黑棋和白棋谁能占这个点超过50%,因为你占到51%,对方不就只有49%了吗?于是谁就赢了。

       好,规则听上去就是这么简单,但是这个玩法就带来两个特点,第一就是它的变化非常多,原文中说了一组数字,一盘国际象棋最大的可能性是10的47次方,而一盘围棋,就按围棋的平均长度算,大概是10的170次方,也就是1后面加170个0,这是个大得可怕的数字,文中说,这个数字比整个宇宙的原子数量还多,所以第一,就是计算量非常大。

      第二,就是围棋在最开始下的时候,棋盘是空空的,所以说前面几个子的可能性非常多,或者说非常抽象,而对于抽象的东西,电脑就不太灵。所以在此之前,人类高手对电脑基本就是砍瓜切菜,但是这次逆转发生在2015年10月,电脑机器人第一次战胜了人类围棋职业高手,比分是5:0,完胜。

      先说对战双方,人类这边是欧洲冠军,叫樊麾,他是个中国人,从小就下棋,目前的段位是职业二段,水平反正在欧洲是够用了,基本是横扫,有点像乒乓球队,中国一个国手到了欧洲就挑大梁的那种感觉。有人可能会说,我听说围棋最厉害的人是九段,你战胜一个二段,没什么了不起吧?不过请注意,围棋的职业二段和九段的差距没有想象中那么大,围棋的段位就是一个参考,有的时候一些职业的五六段也能战胜九段,所以说段位不是一个绝对标准,有点像网球世界排名第80和第8名,也不是没得打,而樊麾的对手,就是这台电脑,它有个名字叫Alpha Go,Go就是英语中围棋的意思,也就是日语里围棋的发音,而且大家都没想到,就是Alpha Go的开发者,竟然是做搜索起家的,就是大名鼎鼎的谷歌,说到这儿的时候,《自然》杂志把电脑战胜人类这件事说成了一个feat,就是英语中的feat,直接翻译过来就是丰功伟业,这个词选得非常大,我帮大家搜了一下feat这个词的造句,一般都是说一些英雄干的大事,什么郑和下西洋什么的,所以说从这个选词可以看出《自然》杂志对于这个事非常看重。

      那么比赛的细节是什么呢?比赛的细节,《自然》杂志里说得不多,我给大家收集了一下,中国的《华西都市报》的记者通过微信采访了樊麾,就是这个欧洲冠军,樊麾说下棋的时候,不是在电脑上拿鼠标下的,而是像传统的那样,用棋盘和棋子下的,在樊麾对面坐着个工作人员,就当电脑的傀儡吧,就是他负责摆子。

      补充一点,这种传统的下法在中国古代有一个专有的名词,叫手谈,也是形容围棋的,就是说两个人是在用手来交谈,之所以选择这种比较传统的方式,是为了让樊麾尽可能地感到熟悉,这样可以充分发挥水平。樊麾说他全程没有感到对方是电脑,感到就是个中规中矩的高手,而且非常强大,他原文用了四个字,叫做像一堵墙。事后五盘的棋谱都公布出来了,于是大家围棋爱好者、高手纷纷过来就围观,看看樊麾怎么败的,大家一看,输得不冤。五盘棋里只有一盘是下到最后阶段的,剩下四盘都是中途认输。围棋的规矩有点像拳击比赛,就是如果比赛很胶着,那就打到最后,双方拼点数,比如红方112:109,于是红方胜了。但是也有中途击倒的获胜,就是围棋里,经常中途一方就觉得自己肯定不行了,就没必要下了,于是就中途认输了,就像拳击里被击倒了一样,那么这五盘比赛,只有第一盘下到最后,剩下的四盘全是中途被击倒。

      大家可以戳一下文稿,我们一起看一张樊麾比赛现场的截图,这个图里有亮点,大家看到拍照的这一刻,樊麾的双手是在空中舞动的,而且是模糊的,动得还挺快,但围棋下棋的时候,手是不用飞到天上去的,所以一看,就是樊麾当时输棋了,所以非常激动,手都挥起来了。

       好,那这五盘棋谱不都出来了吗?于是大家就赶紧盯住这个棋谱看,希望分析出Alpha的棋风,现在普遍认为,它的棋风非常正统,就不讲究那些野蛮的无理棋,什么我不想好好下,你也别想好好下,没有,就非常正统。

       同时,前期布局的时候,樊麾都能占那么一点便宜,但是到了中盘,就被Alpha一点一点往回扳,那么围棋下到中盘的时候,往往伴随着一些激烈的战斗,这个被称为中盘绞杀,这就需要非常强的计算能力,这时候Alpha电脑就占了上风,而且越到后来,Alpha就越精准明,简直是天衣无缝,所以越到后来越绝望。

      那么Alpha凭什么这么厉害呢?咱们还是回到《自然》杂志里,原文说,Alpha使用了一种叫做深度思维,原文是deepmind,深度思维的计算模式,这个模式中有两个网络,第一个叫做价值网络,是Value network。还有一个叫做策略网络,Policy network。什么意思呢?咱们先说价值网络,说白了就是负责控制计算的广度,宽广的广。因为围棋的可能性太多了,不可能电脑把每一种可能性都一路算到黑,这样你电脑的计算量太大了,而这个价值网络就做判断,就是哪些是肯定不靠谱的招数,就不用想了,比如说上来就把你的棋子给对方吃,这肯定不行。这就跟打拳击,你上来就给自己脸上一拳,这倒是可以,但是这种事就不用考虑了,这是价值网络干的,负责控制思想的广度。

      第二个呢,策略网络,策略网络控制的是思维的深度,它就用自己超强的运算能力,就是深挖刚说的六个点,哪个短期对战局好,哪个长期对战局好,因为你知道每个点都意味着一个完整的游戏不同的走势。所以Alpha内部就是这两个,等于是一个点、一个面的网络在轮流发挥作用。

      同时,Alpha还具备一个人类绝对没有的优点,就是它没有人类的情绪的起伏还有生理上的疲惫,高手对决,其实就是比谁不犯错误,一旦你犯了错误,你就会被对方攻击,于是你的情绪就受影响,情绪低落,很快就恶性循环,而电脑呢?没有情绪,我没有压力,我也不会唉声叹气,我也不会得意忘形,这一点它完胜人类。

       好,上面就是大致的战况吧。在《自然》这篇文章的最后,预报了一次终极决战,2016年3月8号,Alpha将出战世界围棋顶尖高手李世石,这是个韩国人。

      从过去十年的数据来看,韩国棋手李世石可以代表人类围棋的最高水平。可能很多人说,怎么到这个时候没找个中国高手,找个韩国人来代表我们博大精深的围棋?大哥,这都什么时候了!你还有功夫琢磨哪国,是吧?人类都快被超越了。

      那么这次终极决战大家怎么看呢?我给大家收集了一些名人的看法,中国19岁的年轻小将柯洁九段看好李世石,顺便说一句,柯洁最近连续战胜李世石,所以他的话是有参考价值的,他在春节期间,在微博上发话说,只能说李世石运气太好了,以现在计算机的实力,战胜李世石的可能性不到5%。

      为什么柯洁说运气好呢?因为背后还有钱啊,谷歌这次掏了一百万美元,李世石赢了就拿走,输了就不用罚款,等于说就只赚不赔,这太好了,所以柯洁的意思是说,李世石这根本就是在取钱。

      被称为四大业余天王的棋手胡煜清八段认为,目前Alpha软件的水平就是业余五段到六段,同时棋手王煜辉七段也持相同的观点,他认为Alpha可能还不到六段,这是棋手们普遍的观点,他们认为李世石的赢面比较大。

      那么我们听听另外一边。谷歌“深度思考”工程的总裁表示,他希望提醒这些看好李世石的棋手们,提醒你们,Alpha是一个会进步的系统,他当时接受一个记者采访,他对记者说,甚至我在和你交谈的时候,这个系统也在进步。听了真是怪厉害的。要知道战胜樊麾是五个月之前的事,这五个月的时间,谁知道它又学了什么新招?

       而搜狗公司的CEO王小川的判断更加大胆,他提出了断言,断言一,Alpha Go将会完胜李世石。断言二,除了围棋,人工智能在其他博弈类封闭游戏里也会横扫一切,完胜人类。

       好,那么人类的代表李世石怎么看呢?

       最近李世石发表了一份声明,他说我很荣幸能够对战谷歌发明的人工智能系统,我认为这将是围棋史上最重要的一场比赛,因此,我接受了挑战,我很有信心赢得比赛。

       哎呀,这话听上去有点像套话,就是我们最需要李世石说点人话的时候,结果他反而说的话有点像机器人说的,这是临阵的镇定呢?还是为了掩盖内心的紧张呢?

       3月8号,Alpha对抗人类,你更看好哪一边呢?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

    Archiver|手机版|小黑屋|( 皖ICP备15008148号-3 )

GMT+8, 2026-6-30 00:40

© 2001-2011 Powered by Discuz! X3.4. Theme By Yeei!

快速回复 返回顶部 返回列表