当前位置: 主页 > 技术方案

王小川 人工智能-王小川乌镇演讲:人工智能是否会出现第三次退潮

发布时间:2023-06-09 16:13   浏览次数:次   作者:佚名

王小川乌镇演讲:人工智能是否会出现第三次退潮图片王小川 人工智能

王小川乌镇演讲人工智能是否会出现第三次退潮在第三次世界互联网大会上王小川发表关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf了下面我们一起看看前面的十二场演讲中嘉宾有讲技术有讲产品我希望给大家的分享一些不同的内容以及自己独有的视角今天大家都提到了AlphaGo作为引爆人工智能的开端深度学习在其中承担了最重要的责任今天当大家开始畅想的时候有可能认为人工智能未来真的会取代人那么我希望今天的分享更多地能够知道人工智能在今天能做什么不能做什么未来终极的理想又是什么AlphaGo之后我们看到最重要的突破领域是在语音和图像领域在文字领域的进展很缓慢今天我们在机器翻译方面取得了一些突破但是问答和对语义的理解是不够的回到图灵测试上个世纪五十年代图灵提出了问答机器推想这样一个概念今天我们直观感受是语音图像进步很快但是自然语言的处理其实是比较慢的抛开技术以一个产品经理的身份来看人工智能有三个产品方向一是识别语音识别图像识别视频识别二是图像我们去生产图像生成识别三是创造大家提到了人工智能进步的层次我想换一个方式描述工程路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理师在人工智能时代会处于越来越重要的位置我们开始提到传统的方法是把规则交给机器随着统计系统的发展包括深度学习我们开始更容易地将答案交给机器在数据的积累下我们就可以让机器变得更加聪明这里面更前沿的方式是将目标交给机器AlphaGo融合了几套算法但是我和他们工程师沟通的时候这样的把目标交给机器的强化学习还并不成熟也就是说如果没有之前三千万局人机对战的棋谱的话AlphaGo没能够做到只通过强化学习来战胜人类这是技术层面需要往下突破的重点如果将目标交给机器机器能够做自我学习这方面有新的突破那我们离新的人工智能时代就更近了今年六月份我去了英国伦敦和DeepMind公司的工程师做了交流我特别好奇的事情就是下棋的第四局机器输掉了发生了什么事情他们说不是程序有BUG就是深度学习本身有瓶颈围棋比赛是三月份我是在六月份去的伦敦已经过了三个月三个月的时间这个问题快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题依然没有解决但是我离开以后一个星期他们的程序能够正确面对之前的第四局棋谱我问他是否这个BUG修好了工程师说没有只是代表第四局那个特定问题正好机器可以解决但是我们依然不知道再什么情况下AlphaGo会继续出错所以深度学习这样一个体系

王小川乌镇演讲:人工智能是否会出现第三次退潮图片1王小川 人工智能

其实还是有瓶颈所在的所以在今天我更多想谈的是以深度学习为代表的今天的人工智能技术还有哪些不靠谱的地方在产品上不适用之处有哪些第一个问题语音识别靠谱吗在百度腾讯都提到了语音识别的能力今天我给大家的演示也用到了语音识别这是搜狗自己的技术在安静的环境里面我们的识别准确度已经到了95甚至97但是一旦有噪音准确率迅速下降当噪音还只是汽车的引擎噪音风的噪音时我们把噪音当成原始数据进入监督学习系统里去把这种噪音变成机器见过的问题之一但是事实上我们见到更多的情况如果同时两个人说话会怎样在今天的学术界依然无解今年六月份我问学术界的人人和机器在语音识别上的区别究竟怎么破解我们用机器的时候采用立体声的方式做定向的识别也就是说我们做一个麦克风矩阵通过立体的方式知道其中一个人在说话把另外一个人说话去掉但人本身是这样干的吗如果把一只耳朵堵上我是否没办法分离出谁在说话或者把两个说话的声音录在一个单声道里面人可以识别吗人当然是可以的所以人的方法和机器不一样人怎么识别因为人的音色不一样还是因为两个人的一个声音大一个声音小还是因为他们不同的语音博士说但凡同时两个人说话的时候只要能够找到差别人就能够把其中的一个声音识别出来所以人在和机器处理过程当中有巨大的不同语音识别最成熟的领域其实还是和人有很大的区别另外一件事情是语义靠谱吗对语言的理解谷歌在之前是用知识图谱的方法解决现在遇到了瓶颈也是今年六月我在一个实验室看到最先进的人机对话系统这个系统可以帮你订餐订酒店对话过程当中机器的表现非常惊艳我们上去试有一个环节机器问你你是需要停车位还是不要停车位这个时候我们回答要或者不要都没问题如果回答我没车大家知道机器会怎么样吗他们完全不理解我没车代表着我不需要停车位因为今天的机器在自然语言概念的理解方面还是远远不够的所以自然语言处理是可以做的但是语义理解到现在还是一个不靠谱的阶段谷歌也在今年发布了一套对于自然语言能够做分析的引擎把主语谓语宾语提出来但是准确度只有90提不上去了因为这个时候光靠统计靠语法已经不能支撑往下是需要对句子当中的具体概念有理解才能消除歧义我们知道不能把马路放在冰箱上面这对于人来讲非常好理解但是对计算机的挑战非常大这是深度学习人工智能还不够的地方很敏

王小川乌镇演讲:人工智能是否会出现第三次退潮图片2

感的问题无人驾驶靠谱吗今天百度在大会上也提出了发布无人驾驶汽车但是从我的了解如果以今天人类的技术我们确实再见过的场景和封闭场景中都可以使用但是对于真正开放的环境不只跑在高速上的汽车以现在人类的技术是不安全的因为这个场景只要没见过可能会犯严重的错误就像AlphaGo下棋一样会突然发疯所以作为辅助驾驶是可以的无人驾驶在真正的技术突破以前还做不到今天的深度学习缺乏推理缺乏对符号的理解如果没有符号对自然语言的理解就会成为瓶颈即便是这样我们也提到了人工智能能够取代一些行业比如说棋手医生司机机器在里面都可以做很好的辅助但是对于大家没见过的创造性的事情比如规划科研其实对于机器来说还很难今天在媒体上机器自动写文章自动画图在科研层面展示出了一些魔力但是还没有到可以取代人的阶段所以在这里面我先把大家对人工智能预期降低下来有人在问人工智能是否会出现第三次退潮前两次我们都认为人工智能到来了但是这次可能会比之前好之前的人工智能两次退潮前我们问一个老师说你是研究人工智能的吗这是骂他的话因为大家认为人工智能不靠谱这次是人工智能第一次真正进入到了使用切实在语言处理声音处理图象处理和在一些高维数据空间上能够比人做的更好所以这次的区别就是大量资金资本投入到了人工智能也有大量的研究人员在毕业以后从事人工智能工作这是和之前不一样的所以一方面我们开始使用这项技术另外一方面我们开始期待不断产生新的突破我个人对这次人工智能的浪潮是乐观的但是我也很紧张也许我们自己做的搜索引擎就是会被颠覆的一部分在这里面我们开始畅想未来的路在什么地方从我自己的描述来看搜索的未来就是人工智能时代的皇冠为什么这么说搜索的未来是什么人工智能的未来又是什么为什么是皇冠简单来讲我认为搜索的未来就是问答机器人因为我们习惯了一件事情做搜索的时候我们先输入关键词然后搜索给你十条结果或者叫十条链接但是这真是最好的方法吗肯定是不够的我们也会提到是否我们用个性化的方法能够使得搜索的结果更准但是其实个性化能够提供的信息非常的有限真正能够使得这个系统变得有用的办法是用问句以前不用问句的原因是因为机器听不懂你在说什么真正到了问句以后机器会从给你十条链接变成给你一个答案就会好很多如果你去问机器四个字乌镇大会机器

王小川乌镇演讲:人工智能是否会出现第三次退潮图片3

不可能给你想要的内容最多把新闻乌镇的百科或者是官网介绍给你只有你问乌镇大会哪天开这个时候机器才能理解你要什么才有机会给你最好的答案我相信随着技术的突破搜索引擎会自然而然演化成为问答引擎很多公司都在做这件事苹果微软亚马逊谷歌这里面起步最早做对话系统的是苹果的Siri但是这个系统并不成功在中国用的人很少为什么因为现在技术没有到来对于自然语言的处理能力自然语言的理解能力非常有限那么为什么苹果这样一个追求极致的公司会把这个系统发布出来呢一种可能性是苹果对技术了解不够另一种可能性是我认为这是乔布斯的一个遗愿我们知道发布iPhone手机的时候乔布斯病重只能躺在病床上看发布会发布会完成之后他很快就离开人世了所以Siri就像一个早产的婴儿在iPhone4s里面发布出来所以我认为这样的系统代表着人类终极人机交互的畅想事实上在大量的文学作品科幻电影里面都会提到问答机器人不管是《星球大战》《超能陆战队》还是《星际穿越》都提到了阿西莫夫的短篇小说《最后的问题》描绘就是人类造了一个机器把所有的资源都用了上去这个机器可以回答其他任何问题却有一个问题回答不了就是宇宙是怎么诞生的这是文学作品对问答机器的思考除了搜索引擎做问答以外咱们知道在中国搜狗输入法在移动端拥有三亿用户输入法的未来是什么呢和自动问答有关系大家一起来看一个视频之前我们讨论输入法的时候很多朋友和我说语音是最重要的搜狗有完整的语音识别技术和语音合成技术但是在我内心这个远不是输入法的极致输入法真正的极致是能够开始寻找信息帮你思刚才给大家演示的是搜狗输入法的分享的能力真正的回答能力可以在后面给大家做一个新的演示在我们讨论问答技术和讨论人机对话的时候输入法也许是最好的一个切入场景输入法作为一个人的分身更容易帮助你建立思考输入法也会从一个拼音工具走向一个对话和问答系统搜狗有两个核心产品一个是输入法一个是搜索一个是搜索信息一个是表达信息随着AI技术的发展我们能更好地解放人的思考我们有一个理念包括两件事情一个是做自然的交互不只是语音还包括语言另外就是做知识的计算能让机器开始逐步建立推理的能力搜狗输入法在中国拥有最大的语言数据处理积累我们有机会在这个领域取得突破这是我今天的分享谢谢大家