日本人工智能围棋-人工智能时代即将到来,我们不能只知其名
Artificial Intelligence,简称AI,即人工智能。自从2016年3月,阿尔法狗以4:1的战绩,战胜了围棋界顶尖高手李世石的那一刻开始,人类就彻底相信人工智能的无限可能。科学家们看到了人工智能的发展希望,商人们看到了人工智能世界里的黄金宝库,普通的吃瓜群众看到了人工智能正要和自己的生活悉悉相关……
智能家居,智慧工厂,无人驾驶,无人超市……人类曾经为偷懒找各种理由,现在不用了,因为很多工作即将由机器代替。这时日本人工智能围棋,就有一些人开始对人工智能的发展产生了莫名其妙的恐惧,因为连医生这样的工作,都可以由智能机器人代替,更何况一些没有什么技术含量、进入门槛很低的服务、体力劳动类岗位呢?
所以,以前我们或许会因为忙不完的工作而烦闷;未来,我们或许会因为没有劳动机会而犯愁。以前,我们在工作中的竞争对手是比我们努力,比我们厉害的同事;未来,我们的竞争对手或许就是一台不知疲倦的机器。
不管如何,人工智能时代终将到来。到时,我们该如何应对,该如何生存,该如何活得更好……等等这些问题,我们或许来不及思考,但有一点可以肯定,我们一定可以和人工智能相处得很好,毕竟人工智能是人类自己创造出来的,聪明的人类创造出人工智能,是为了促进生产力发展,给人类文明进步添加动力。
因此,我们无需恐惧,只要安静地接受一个新的美好时代即可。但是,我们也不能什么也不做,既然人工智有时代即将到来,我们不能只知其名,不知其史。
日本著名科学家,世界人工智能领域的代表人物:山本一成写了一本书《你一定爱读的人工智能简史》,这本书以人工智能在围棋领域的应用为主线,穿插讲述作者本人开发的“PONANZA”日本将棋程序的发展历程,PONANZA程序、谷歌公司开发的阿尔法狗、IBM公司开发的“深蓝”是人工智能发展史上的三大标杆。
图书封面
《你一定爱读的人工智能简史》讲述了人工智能向人类学习的历史,同时,也是讲述人类如何让机器学会向人类学习,学习人类的技能、经验的探索历史。
总结起来讲,人工智能的学习历史分为“机器学习”、“深度学习”、“强化学习”等三个阶段。通过了解人工智能的学习历史,可以快速而轻松地搞明白人工智能到底是怎么回事,对其有一个比较深入而全面的了解。
图片来自网络
01 机器学习技术的诞生,让机器学会了模仿人类行为
人工智能并非一开始就很火爆的,在研究人工智能的历史上,研究人员曾一度连经费都申请不到,他们为了申请经费,不敢声称自己在研究人工智能,而是以机器学习的名义申请经费,这段历史称为人工智能的寒冬。
在机器学习的初级阶段,主要是采取仿真和模拟的方式,让机器学习并理解人类的某些行为和动作。
所谓仿真,其实是一种搜索技术,他是一种非常机械的、以正确答案优先的预测方法。所以,简单地讲,仿真,其实就是指搜索。这个阶段的搜索,采用的方式也是很笨的,基本上是在一个很大的数据库中,按既定的关键字匹配,寻找符合要求的答案。
模拟呢?比仿真要高级一点日本人工智能围棋,这个技术会根据相应的指令,去判断正确的答案应该在哪一个数据表中,这样一来,看上去好像提升了机器的智能。其实,也并不智能,因为机器做出什么样的判断,是程序员提前设置好的指令。无非就是在一个固定的模式下,机器在搜索的基础上,增加了一个基于固定指令的判断功能,也就是所谓的评估功能。因此,所谓的模拟,也可以理解为仿真+评估,或者说是搜索+评估。
显然,这种智能不是人类想要的。
先前,我们以为只要把人类的知识传授给机器,把能力复制给机器就行了,但事实上,机器压根搞不懂我们的意图,我们编写程序,试图让机器明白应该怎么做,但结果却像对牛弹琴,并没有达到理想的效果。所以教机器学习也罢,给机器赋能也罢,复制能力给机器也罢,这些事情原本想着很简单的事情,实际操作起来,难于上青天。
可是,要如何才能把人类的专业知识告诉给机器,让机器拥有智能呢?机器学习技术应时而生。
什么是机器学习技术呢?机器学习技术,指的是还不能完全理解人类的学习方式,但可以模仿人类学习行为的一种计算机技术。
科学家为了让机器快速掌握一个专业领域的知识,比如,让机器成为一个围棋高手,采取的办法是:把各种围棋高手对决过的棋局盘面做成模板,写进程序中,说白了,就是把已经发生过的情况,全部做成模板,这些模板被程序员数字化以后,整理成一个庞大的数据库,然后让电脑学习这些模板,这种方式,被称为监督式机器学习。
这个学习方法真的很管用,先学习高手们的经验,可以快速提升能力,掌握知识。但是,仅仅这样就行了吗?显然不行,让机器学习模板,但是模板毕竟是有限的,而人的思维是在不断变化的,是在不断创新的。一旦出现新的情况,机器就无法理解,其笨拙的行为就会显现出来。
所以,机器学习必需有足够多的模板,这些模板就像是机器的老师一样。现实情况是老师严重不足,拿围棋来说,到2018年,已经发生的棋局才5万多局,要想让围棋机器和人对决,仅仅学习这些棋局,显然不能取胜顶尖高手。
怎么办呢?必需打破人类教机器的模式,得让机器自己学会学习。有了这个需求,相应的技术也就随之诞生了,这个技术,叫深度学习技术。
图片来自网络
02 深度学习技术的诞生,让机器自己教自己如何学习
阿尔法狗打败了世界围棋顶尖高手李世石,证明了机器的智能完全可以超过人类。那么,阿尔法狗为什么会拥有这么厉害的智能呢?机器的深度学习技术,起到了非常关键的作用。
什么是深度学习技术呢?
所谓深度学习技术,是从“神经元网络”技术发展起来的,也可以讲,“神经元网络”技术,就是深度学习技术的前身。这个神经元网络技术,其实已经有了70多年的历史,以前的科学家们曾为之痴迷,因为神经元网络是模拟人类的大脑构建的。
《你一定爱读的人工智能简史》内页
那么,问题来了,神经元网络技术发展那么早,而人工智能技术的发展历史还不到20年,既然神经元网络技术那么厉害,为什么人工智能一开始不采用神经元网络技术呢?
原来,神经元网络技术那个时候虽然理念先进,但是在实际的研究中,到底如何应用,没有取得什么实质性的突破。比如,让机器识别一个水杯,正着放,机器能识别,倒过来放,机器就不能识别。
这怎么办,那就穷举,把杯子的各种颜色,各种摆放,全部让机器记忆下来,这样的话,在很多情况下,机器都能正确识别杯子。这看上去是个不错的方法,但实际上,这一点也不智能,而且需要耗费大量的存储和计算功能,太不划算了。就像人类学习,我们不能为了打100分,就把所有知识点都死记硬背下来,肯定没有人乐意那样做。而且,全背下来,没有理解的话,也不一定能打100分。
这时,科学家们想到,不能让机器傻傻地把所有情况都背下来,虽然我们需要机器学会深度学习,但是,我们要防止机器过度学习。因为过度学习,不仅浪费资源,而且还有一个最大的隐患,就是当机器碰到新问题时,它记忆的情况越多,出错的概率越大。
如何防止机器过度学习呢,唯一的办法是:脱离!
怎么脱离?比如,还是让机器识别一个水杯,在深度学习的基础上,加上脱离技术以后,可以使机器在学习过程中,随机抽取神经元,并让该神经元脱离神经组织,由于缺少神经元,机器不会全盘记忆。这时,可以让机器记住杯子的局部特征,从而使机器在没有全盘记忆杯子的各种情况时,也能正确识别杯子。
可是,采用脱离技术后,机器在深度学习时,是如何由全盘记忆转向记忆局部特征的呢?科学家们也解释不清楚,《你一定爱读的人工智能简史》这本书的作者山本一成,把类似于脱离技术一样难以解释清楚的技术问题,统称为“黑魔法”。
不过,自从有了这些黑魔法的帮助,深度学习技术得到了快速发展,比起之前的监督式机器学习来,要强太多了。发展到今天,深度学习技术的输入、输出设计非常自由。比如,输入声音,可以输出图像,输入图像,可以输出合适的文字说明。这样的构想,被称为“多路径协作”。当图像、文字、声音可以随意转换并呈现出来时,看上去是不是显得很智能?
《你一定爱读的人工智能简史》内页
当前,关于深度学习的多路径协作,随着“将语言当作图像来处理”这个方法的诞生,科学家们发现,不论是语言文字还是其它,只要能设法与图像关联起来,立即就会产生深度学习效果,这个有点类似于我们人类记忆东西时,如果把记忆对象转换成图像,就可以进行快速记忆,而且可以增强记忆效果一样。不过,机器把文字转换成图像的处理能力,比人类要强大N倍。看来,智能的本质即为图像。
随着深度技术的发展,机器已经学会了自己教自己,机器拥有了自学能力。不过,机器的智能要想超过人类,仅仅依靠深度学习技术,是不行的。为了追求突破,人工智能的发展史上,出现了强化学习技术。
图片来自网络
03 强化学习技术的诞生,完整展现智能学习的“守破离”路径图
如果说之前的监督式机器学习和深度学习,分别是:“守”和“破”。那么,强化学习技术的诞生,就是“离”。《你一定爱读的人工智能简史》这本书的作者山本一成,用“守、破、离”来形容人工智能学习历史上的三个阶段。
“守”,指的是小白阶段,也就是机器学习的初始阶段,机器非常老实,非常听话。老师教什么,就学什么,老师让干什么,就干什么,老师说走路得先迈左脚,它就一定不会先迈右脚。说白了,就是一切听老师的,谨遵教诲和示范动作。
“破”,就是深度学习阶段,指练好了基本功以后,感觉自己有了一定的基础,也学会了最精华的知识,长本事了,就不甘于现状了,求知欲更强。于是,就想向更多的老师学习,自己偶尔还要总结一下不同老师的优势,让自己变得更厉害,有点自主学习,而且还能学有所成的味道了。
“离”,就是自创了一些招式之后,就想自立门派了,这就拥有了强化学习技术,进入到了强化学习阶段。
插入一句题外话,其实我们人类学习,也可以参考这种学习模式,或许能提升我们的学习能力。
那么,什么是强化学习技术呢?其实,人类和人工智能在学习的过程中,都会采取“监督式学习”和“强化学习”两种模式。
监督式学习,必须有老师的示范作为模板。而强化学习呢,不需要老师。强化学习是让计算机重复对未知领域进行搜索,然后反馈结果的方式,使计算机在重复反馈的结果中,不断强化“评估”能力,从而得到正确答案。因此,强化学习,重点是在于反馈过程,一直在重复进行。
《你一定爱读的人工智能简史》内页
有了强化学习技术以后,机器可以抛开所有模板,自行思考,自行决策。随着人工智能技术的发展,在不久的将来,机器可以自己编写程序,自己创造自己,自己改造自己,这是不是显得更厉害了呢?当然,这也让很多人感到担忧,生怕再这样下去,机器会超越人类,到时候可能会发生人、机大战?有没有可能呢?
或许,人工智能,终将超越人类,但还有很长的路要走,因为人工智能不等于人类智慧,机器拥有智能,但要想拥有和人类同等的智慧,现在还不敢想象。
不过,我们确实该想想,在未来,该如何与机器相处……