当前位置: 主页 > 技术方案

人工智能打败围棋冠军-围棋人工智能打败世界冠军的工作原理歌

发布时间:2023-06-23 09:05   浏览次数:次   作者:佚名

战胜围棋世界冠军的人工智能的工作原理

歌作为世界上最好的 AI 公司之一,其实已经做了类似的探索,那就是阿尔法围棋(AlphaGo)。作为第一个战胜围棋世界冠军的人工智能机器人,AlphaGo 由谷歌旗下 DeepMind 公司戴密斯·哈萨比斯(Demis Hassabis)领衔的团队开发,其主要工作原理正是 “深度学习”。

人工智能战胜人类围棋冠军

是阿尔法狗。战胜的人类。

围棋人工智能打败世界冠军

是电脑人工智能阿尔法机器人

人工智能围棋战胜人类

人工智能击败围棋顶尖高手,在棋界没在引起强烈震动,显现了对这个事件的极大重视人工智能打败围棋冠军,原因或许有一下几个方面:

一是,我国是文明古国,历史以来琴棋书画被崇尚,围棋被视为棋类里的阳春白雪,集智慧和艺术之大成,无数人痴迷热爱。简单的讲围棋的地位崇高。

二是,人工智能这一现代前沿科技,虽然只有几十年的历史,但是在它发展的历程中,始终用能否会下棋,会下什么棋作为一种检验方式,比较近的是1997年“深蓝”战胜国际象棋世界冠军卡斯帕罗夫,当时震惊全世界。惊呼“人类的尊严不再”、“攻克人类智慧的堡垒“。仿佛人工智能欲将统治人类的日子就要来临。可见,人们对在棋上输给机器是何等的关注!

三是,围棋在如今流行的几大棋类中是最为复杂的,据说变化有10的170次方之多,比宇宙中的原子数目还要多。如此复杂的变化过去人类总是以为只有自己才能应对,阿尔法狗战胜围棋世界冠军时人们是难以理解和接受的。

四是,人们的认识产生了矛盾。如今最为先进阿尔法零,已经不需要人类的任何经验只根据规则学会围棋、国际象棋、日本将棋,并轻松战胜之前任何的棋软,人类棋手望尘莫及。机器没有智能,却成为了人类的老师。

总之,人们的惊诧与不解,让人们不得不严重关注。

赢过人工智能的围棋手

围棋曾被视为

“可以抵挡电脑进攻的最后阵地”

围棋与芯片成为新一期英国《自然》杂志的封面,因为一个名为alphago的电脑程序战胜了围棋欧洲冠军,这是第一次有电脑程序能在不让子的情况下,在完整的围棋竞赛中击败专业选手。

据英国《自然》杂志网站1月27日发布的最新一期学术论文,2015年10月,谷歌公司下属的“深度思维”公司开发的alphago电脑程序在英国伦敦以5比0的战绩打败了三届欧洲围棋冠军、前中国职业棋手樊麾。由于论文评审的保密流程,对局详情刚刚被刊登出来。

其实,早在1997年ibm公司研发的超级电脑“深蓝”就战胜了国际象棋世界冠军卡斯帕罗夫。这场胜利,拉开了在棋类竞技比赛中电脑向人脑叫板的序幕。2006年,中国象棋也宣告沦陷。在“浪潮杯”人机大战中,电脑“浪潮天梭”战胜中国象棋特级大师柳大华等人。

不过,果壳网署名“开明”的文章中还是用“人类最后的智力骄傲即将崩塌”来渲染这一次alphago的战绩,这是因为,很多人都把围棋视为“可以抵挡电脑进攻的最后阵地”。此前一些观点称,至少还要10年甚至100年人工智能才能战胜围棋职业棋手。

计算围棋,确实比国际象棋和中国象棋都要困难得多。“围棋具有巨大的状态空间复杂度和博弈树复杂度,又在本质上无法做准确的静态盘面评估”,这使得即使采样样本足够大,也有力所不逮之处。北京邮电大学教授、计算机围棋研究所所长刘知青用以下一组数据来说明:从状态空间复杂度(用于搜索)来看,围棋是10172,中国象棋和国际象棋分别只有1048、1046;从博弈树复杂度(用于决策)来看,围棋是10300,中国象棋和国际象棋则分别只有10150、10123。

另一重复杂,是围棋落子选点无法验证。一手棋有多大价值,数学证明,或搜索验证,都难以胜任。“分析围棋棋子位置,数目的多少,以及棋子之间的静态关系(例如影响函数),无法完整、准确地评判围棋棋子的作用和最终死活;围棋棋子的作用和最终死活必须由博弈的具体进程决定”。

简单而言,围棋的下法可能多达10的700次方,比全宇宙的原子数还多,而国际象棋的下法大约只有10的60次方。所以说,围棋这种源自中国的古老游戏更加“烧脑”。就在去年11月,在北京举行的“美林谷杯”计算机围棋锦标赛上获得冠军的程序“石子旋风”,在人机大战中仍然不敌人类职业棋手。所以,尽管alphago此次完胜的对手并非职业顶尖棋手,中国围棋队总教练余斌九段仍感觉“吃惊”。以往认为,计算机围棋“100年都不会有突破”的他,从中看到“关键的突破点已被找到”。

人类也下不过电脑了

让电脑学会下

到底有多难?

以往的下棋电脑程序都是运用传统的智能运算方法,即对所有可能的落子位置建立搜索树,但这种方法在对付围棋时就失灵了。“无论如何,枚举所有情况的方法都是不可行的”,所以研究者们祭出了终极杀器——“深度学习”(deeplearning)。这是目前人工智能领域中最热门的科目,它能完成笔迹识别、面部识别、驾驶自动汽车、自然语言处理、识别声音、分析生物信息数据等非常复杂的任务。

据专家介绍,alphago应用的是目前人工智能领域最热门的卷积神经网络技术,能模拟人脑神经元,具有深度学习、主动识别、自适应等功能,在图像处理方面异常强大。其核心成功应用了两种深度神经网络:“策略网络”(policynetwork)和“价值网络”(valuenetwork)。

“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。这样就可以将盘面落子选点从几百、几十个大大缩减为三五个,逐渐接近职业棋手;

“价值网络”则负责减少搜索的深度——ai会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑后者。这也是最难的,在盘面形势判断上,通过职业棋手棋谱的验证、筛选,给出下一步的预判,这比以往基于海量数据的“蒙特卡洛树搜索”(未加任何验证)对职业棋手盘面符合率达到40%—50%要好很多。

这两种网络合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。这样alphago在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

谷歌公司说:“我们用人类职业棋手的3000万步下法来训练‘神经网络系统’,直到它能以57%的准确率预测职业棋手的下一步走法。”

值得一提的是,人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以alphago只要经过了足够的训练,就能击败所有的人类选手。

人工智能会迈出

真正挑战人类的“关键一步”吗?

alphago这个名称由两部分组成,alpha对应希腊语的第一个字母,有“首要、关键”的意思;go来自日语对围棋的称呼,在英语中也有“行走、前进”的意思。因此,alphago也许可以意译为“关键一步”。

接下来alphago将在今年3月挑战韩国棋手李世石。李世石曾多次赢得围棋世界冠军,所以这场大赛,被视为是电脑与人脑竞技大战中的“关键一步”。“这是第一次有电脑在公平规则下挑战人类顶级职业围棋手,我很荣幸成为这名棋手,”李世石说,“无论结果如何,都将是围棋历史上意义重大的事件。”

如果电脑赢了,一个科幻般的念头可能会浮上许多人的心头。既然在棋类游戏中人类已经没法阻止电脑,那么未来是否真会像《终结者》、《黑客帝国》等电影里那样,出现电脑满世界追着人类打的场景?如果李世石赢了,人们心中也不会太轻松。毕竟许多人认为还要过很多年才会发生的事情,已经逼近到眼前。电脑更新换代的速度有目共睹人工智能打败围棋冠军,谁知道人类还能阻挡它们多久?

在人工智能领域,还有另一个著名的关卡是“图灵测试”。这种由著名计算机科学家图灵提出的测试,是让电脑模仿人类与人类裁判“对话”,如果成功诱使人类裁判认为与之对话的是人,则通过测试。2014年,在英国皇家学会于伦敦举行的“图灵测试”竞赛上,一台名为“尤金·古兹曼”的电脑通过了测试。

电脑在与人脑的大战中不断过关斩将,但它们目前还面临一个限制,那就是还不会将其智能“通用化”。“深度思维”首席执行官德米什·哈萨比斯说,alphago目前只会下围棋,如何将这种智能用于其他领域还是一个挑战。如果电脑能够突破这个限制,无疑会将人工智能带入一个新的境界。

在推动人工智能发展的过程中,人类如何在伦理上“控制”电脑也是一个挑战。如一些科幻电影描述的那样,许多人担心人工智能的发展可能会带来灾难,著名科学家霍金就曾表示人工智能可能会导致人类灭绝。因此,科学家也需要注意让人工智能不会迈出真正挑战人类的“关键一步”

人工智能击败围棋冠军

1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美的智力骄傲被狠狠地碾压,想想都要哭晕在厕所。

另一边,围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这也很正常,国际象棋中,平均每回合只有35种可能,一盘棋只有80回合;围棋每回合有250种可能,一盘棋可以长达150回合。这都不是数学能解决的,有一个叫“策略”。说白了,就是套路。人心犹如海底针,岂是一个凡俗机器人能懂的?