人工智能专家系统网易-(云端留声机)第三十二期:关于人工智能的发展以及其应用的那些事
ADM在线栏目【云端留声机】,每周分享设计大咖们对于设计、对于创意、对于生活的种种看法。
2020 ADM展会论坛现已圆满落幕,为了各位意犹未尽的粉丝们,后面我们将陆续为大家带来各位嘉宾的精彩分享,请持续关注“云端留声机”栏目哦~
今年ADM的开幕论坛,聚焦在了设计交叉融合的新领域——科技艺术。我们邀请到了一批敢于以科学概念和前沿技术为己用的行业大咖嘉宾,他们正在用最直观的方式,聚焦设计对于艺术、科技以及生活所带来的的无限创想,解决一个又一个在这个新领域中发生的问题。【云端留声机】第三十二期,让我们一起听深尚科技CEO、首席科学家浣军聊聊,关于人工智能的发展以及其应用的那些事。
1
— 人工智能的发展与标准—
在创办深尚科技之前,我曾经在美国大学里当教授,在百度大数据实验室做主任,所以我自己本身就是一个人工智能的研究者和实践者。所以在这里也想先跟大家简单分享一下关于人工智能发展的历史。
人工智能发展的历史很有意思,它不是线性的,而是呈曲线状的。它经历过几起几落,每次的回落就叫做人工智能的寒冬。
上个世纪50年代,在美国达特茅斯学院中,人工智能与认知学专家马文·闵斯基、信息论创始人克劳德·香农、计算机科学家艾伦·纽厄尔、诺贝尔经济学奖得主赫伯特·西蒙等科学家聚在一起,“人工智能”这个词就在这里被首次提出。
试想一下,机器如果能够像人一样思考,能够像人一样对外界世界进行感知和推理,这是多么大的进步。之后,人们开始大规模的进行尝试,如果机器能进行逻辑推理,我们便认为它拥有了智能。于是,人工智能迎来第一次繁荣期。
但紧接着人们也发现了问题,就是只有逻辑推理是不能够解决很多复杂问题的。所以就在70年代末、80年代初,人工智能出现了第一次寒冬。当时出现的是什么现象呢?美国国防部把对人工智能的资助砍掉了,很多学校里面招研究生的规模下降,老师也不再做这方面的研究。
进入80年代,当时IBM提出,如果我们能够把知识进行数字化,建立起专家系统知识库,然后把这个知识应用到新的行业,那么这时候机器就能够帮人做决策。于是在这之后人工智能又迎来了第二次繁荣期,很多人都涌入到这个领域中,因为大家觉得这一次可能可以用机器解决复杂的问题了。
IBM也在很多行业建立起专家库,也取得了非常大的进展。但在实际应用过程中,还是发现很多复杂的问题无法得到解决。这个时候,人工智能进入了第二次寒冬。
到了90年代中期,人们发现,如果通过收集大量的数据来描述这个世界,并且让机器具有一定的学习能力,那么机器是可以根据我们提供的数据自己建立模型,从而做决策辅助。从这条线上看,2000年后就开始出现了深度学习,再次引发人工智能热潮,各个方面也都有了蓬勃的发展。
讲了那么多人工智能的厉害之处,可能会有人问:究竟怎么才算达到人工智能?
其实这就涉及到著名的“图灵测试”。图灵提出的这个标准非常有意思,他把测试者与被测试者(一个人和一台机器)隔开,他们只通过网络进行交流。如果在交流期间,机器能让测试者相信它是人类,那么这台计算机就可以被认为具有人类的思考能力,它也就通过了图灵测试。
图灵还提出来另外一个加分项,如果机器能说服测试者,令对方相信自己是电脑,那么图灵认为这台机器的智能达到了一个新的高度。
举个例子来说的话,2016年在佐治亚理工有一门叫做编程语言的课,这门课大概有200多个学生,这门课上有一位助教——沃森小姐,沃森小姐从来没到过课堂,一学期下来大家与沃森小姐的沟通都是通过电子邮件。一个学期之后,老师告诉同学们,其实沃森小姐是一个智能体。
在美国,佐治亚理工的计算机专业是非常强的,大概能排进全美前十。选计算机编程课的同学们大多也都是比较聪明的,但在这一学期中,却没有人 找老师质疑过沃森小姐的存在。这就是人工智能中很有意思的一个例子。
2
— 深度学习:人工智能的”神奇魔杖“—
▎深度学习崛起,拓宽人工智能领域范围
从专家系统建立,然后开始有了机器学习,那时候还只能叫浅层机器学习。当时的人们花了大量的精力,想要在数学上证明:当你的数据量越来越大,机器就会变得越来越聪明,它所学习到的东西就会越来越接近最优的那个模型。
从2005年、2006年开始,深度学习开始崛起,首先从神经网络开始。神经网络其实并不是一个新的概念,早在70年代,神经网络就已经被大量应用。当时人们已经证明了,如果你用一个两层的神经网络,就可以模拟世界上任何复杂的函数。
这也就是说,只要拥有足够多的数据、足够多的神经元,无论这个世界多么复杂,我们都可以用一个函数去无限接近它。但实际上我们不可能有那么多数据人工智能专家系统网易,当时也没有那么大的计算能力,所以在有限的条件下,效果并不理想。
要理解什么是深度学习,人们首先需要理解它是更广泛的人工智能领域的一部分。简而言之,人工智能涉及教计算机思考人类的思维方式,其中包括各种不同的应用,例如计算机视觉、自然语言处理和机器学习。
机器学习是人工智能的一个子集,它使计算机在没有明确编程的情况下能够更好地完成任务。企业使用机器学习来进行欺骗欺诈检测、推荐引擎、流分析、需求预测和许多其他类型的应用。这些工具随着时间的推移而不断改进,因为它们摄取更多的数据,并在数据中找到相关性和模式。
总结来说,机器学习是实现人工智能的手段,而深度学习是机器学习中的一种方法。
正因如此,深度学习的崛起开启了一个新的浪潮。这里面有几个核心元素,首先就是数字化的大规模应用。比如现在的5G,下载速度可以达到1个G/秒。而在十年前,那时候虽然网速没这么快,但从互联网公司开始,就已经开始积累了大量的数据。
这些数据不是指具体数字,而是它对每个人的行为、位置、购物习惯、网上浏览习惯等进行追踪,并通过数字化呈现。尽管从某种程度上来说这对隐私造成了一定的侵害,但从另一方面来看,它的确带来了极大的便捷性。
有数字表明,2013年那一年收集的数据是从人类文明开始到那一年所有数据的总和,然后之后预期基本上每隔几年这个数字就会翻一番。2013年收集了4.4个ZB,那到2020年底将收集44ZB。
芯片的计算能力是每18个月翻一番,而现在人工智能的计算能力是每6个月翻一番。这意味着18个月期间,它就翻了23次方。然后人工智能向对应的文献也是每18个月翻一番,打个比方来说,比如读研究生大概需要三年,那么在这36个月期间,对应的人工智能文献已经翻了两次(4倍)。
2012年是深度学习的元年,那一年发生了三件事情。第一件事情是深度学习在大规模图像标注上面第一次超过所有人的方法,一下子将准确度大大提高。第二件事情发生在微软,加拿大亨特教授的一位研究生去了微软机器翻译实习,他运用多层神经网络的方式,达到了比微软最资深工程师做的机器翻译更好的效果,这让微软马上意识到深度学习的重要性。
第三件事也很有意思,当时默克是世界上最大的制药公司之一,他们组织了一个竞赛,来预测小分子的活性。最后又是亨特教授他们组拿了全世界第一,同样的他们也是用了叫做深度学习的方法。
而后,深度学习开始在各个领域迅猛的扩张,首先从图像处理开始。我们看一下例子,大规模图像识别AI超过人类。它可以识别花草、动物等,2015年开始,这个错误率降到了5%以下。
为什么5%是一个特别重要的数字呢?因为就算不提人类专家会不会累,他们看几十万张图片、上百万张图片,错误率大概也是5%,这也就是说这时候机器识别的能力已经比最好的人类专家都要强。最早在深度学习之前,基本还是20%多的错误率,从深度学习第一年起错误率就降低了10%,然后迅速地提高。
除了在识别方面有了进展,在策略游戏上面更是取得了巨大的进展。2016年、2017年,这时候大家都听说人工智能、深度学习了,为什么呢?因为AlphaGo第一次击败了世界上顶尖的棋手李世石。
提到设计方面的话,下面这些图片,所有的这些脸包括前面的场景,其实也都是人工智能画出来的。
随后人们又开始使用深度学习进行推理,我们在百度做的工作,主要就是在云端提供自动化建模的算法和实现,用深度学习来设计深度学习算法,它的目标是让深度学习的算法更容易被中小企业使用,提升他们使用AI的能力。
▎深度学习的下一个热点:生成对抗网络
那么到底是什么导致我们现在看到的机器具有一定的智能性?
首先就是所谓的“见多识广”。人们给机器的数据越多,它的学习效果就越好。比如说滴滴预测大家从一个点打车到另一个点需要多少时间,随着数据的增多,它的预测就会越来越准确。
第二个是机器开始具有一定的举一反三的能力。这个是我们当初在百度做的一项工作,我们用了大概一百多万张图片去训练一个网络,让它具有标注的能力。但这一百多万张图片都是一些自然图片,比如说车、船、动物、植物。
然后我们把这个模型通过少量的数据进行精修,再用到别的领域中,比如用到疾病的分类,用到癌症细胞的分类,它也显示出强大的分辨能力。意思就是尽管原来的数据让机器只看到了很小的癌症细胞数据,它大量看到的是车、船、动物、植物的数据,但它也已经具备了举一反三的能力。
这过程中涉及到一个核心技术,叫做生成对抗网络。它分为两部分,一部分它是一个生成器,他可以输出一幅图画,刚开始效果比较差,但因为深度学习具有举一反三、见多识广的特点,慢慢地它能力提高了,可以画得越来越好。
但为了让它画得更好,生成对抗网络还有另一个身份,就是作为一个老师或者评判者,它会告诉这个生成器,什么地方生成得好,什么地方生成得不好。在这两部分相互作用下,使得生成器效果越来越好,它输出的东西也越来越逼真。在这个基础上,就可以输出高度逼真的人物形象、自然形象、语言的生成包括语音的生成。
简单来说,就是生成模型的发展使得机器能更像人类一样去学习和创造。
3
— 人工智能在时尚设计中的应用—
下面与大家分享一下,目前我们通过设计和人工智能的结合,在服装设计上的一些探索。
众所周知,我们国家是一个服装大国,世界服装贸易的三分之一来自于我国,一年的生产超过200亿件衣服。但是我们不是一个服装强国,中国的所有上市的服装企业的市值加起来,还不如ZARA。当然,现在应该说行业在进行一场深刻的变革,这场深刻的变革我们觉得核心就是从生产制造为中心,转向品牌、转向设计、转向对终端用户个性化需求的深刻理解。
目前我们拥有一些核心的技术,针对服装的识别、智能设计、效果预览等。其中最核心的是我们提出了一个概念,叫自主人工智能。
前面提到的很多技术叫弱人工智能,它依赖于大量的数据,这些模型可控性、可操作性不强。拿设计名片来说,弱人工智能为你提供的只是它拥有的那些模型,但如果做到了强人工智能,就相当于你拥有了一个人工智能设计师,你跟它的交互完全是通过网络,它会给你一个名片设计,你提出修改意见后,它又会给你一个新的设计。
从弱人工智能到强人工智能之间,中间当然还有非常艰苦的步骤要做,所以目前我们提出来一个自主人工智能的概念,就是让深度学习自己设计深度学习网络,他自己寻找他自己的优化器人工智能专家系统网易,他自己找到他自己合适的数据,他自己知道他要学习的任务。
目前我们取得的一些进展也可以与大家分享一下,例如包括像服装自动设计,我们通过训练智能体,让它可以直接设计服装,可以出手绘稿,也可以直接出造型图。
像下面这张图,就是智能体看了小香风以后,利用生成对抗网络设计出来的,连模特带人都是智能体画出来的。
还包括可以服装一键上身,可以换各种参数、换面料、换领形袖形。
另外,还有高仿真的虚拟模特生成。下面这张图里的形象都是人工智能画出来的,包括他们的表情、姿态、发型,都是人工智能体进行编辑的结果。
在此基础上,再结合前面的一键上身,就能看到衣服如果穿到模特身上会是怎样的效果,这样可以降低开发的时间与成本。
其实AI和设计的结合还有无限种可能,大家有兴趣的可以多多去了解一下。
最后,我想说,随着技术的不断成熟,人工智能在未来的应用必将更加广泛。但我们要记住,AI不是来取代人的,AI作为一个工具、帮手、合作伙伴,是来帮助设计师,让他们灵感绽放的。设计的核心是创造性的思维,在这一点上,AI是无法取代设计师的。
(本文未经授权请勿转载。以上内容整理自2020ADM展会论坛——“作为艺术科技的设计”,若有不恰当之处,敬请谅解,欢迎批评指正。)