人工智能认知研究-国家语音创新中心首席专家张熠天:乐观而审慎
随着大模型能力的“涌现”,各行各业都处于兴奋当中,通用智能似乎为数字经济的未来找到下一个可行的通路,并视为移动互联网之后的下一个“风口”。
6月16日,在2023年华映资本年度大会上,国家语音创新中心首席专家张熠天对待这种“热情”做出了他的回应——乐观而审慎。
张熠天有多重身份,他既是研究学者,也是国家人工智能相关政策的起草者之一,还是人工智能国际治理双边、多边对话的参与者。
张熠天以《从政策到路径——AIGC演进框架初探》为主题,围绕大模型的突破与局限、生成式人工智能所带来的变革、国家人工智能政策走向,数字经济前沿未来发展方向等话题进行了系统的分享。
利用大模型对生产和服务业进行数字化改造,破解了用工荒问题;让搜索和获取知识的成本降低,改变人机交互模式;大模型作为“生产力工具”的能力开始凸显,我们将逐渐看到行业被大模型重塑的例子,但这也带来了新问题。
张熠天尤其提到,传统产业在建立“护城河”之前,盲目地拥抱大模型或许不是好的选择。大模型的迅猛发展对数字经济提出更高的安全和治理要求,不能仅从技术角度单纯地看待大模型和人工智能的发展,它更是一个产业问题,并直接关系到一个国家经济的核心竞争力,从深远上看,更关系到国际政治经济的话语权。
以下为张熠天演讲实录,华映资本略作整理:
AGI是大模型认知的上限
大模型是时下最热的话题,中央网信办对大模型的管理和发展正在向全社会广泛征集意见,有传闻大模型要进行牌照化管理。大模型的发展会带来怎样的商业模式?会对技术的发展、产业的演进和商业的变革产生哪些影响?
分享分成五个方面,第一个是讲一下大模型的根本是什么。各种论坛对大模型介绍很多,但是我认为现在很多介绍是有局限性的。第二个是介绍一下大模型带来人工智能生成的技术,会对产业发展带来哪些变革。第三个是介绍AIGC的发展路径,会往哪些方向走。第四个是介绍一下我们国家关于大模型和人工智能政策的走向,以及政策变化的问题。最后,介绍一下未来由大模型带来的人工智能技术产业的变化和整个数字经济的演进走向,争取能让大家少走一些弯路。
第一部分,大模型何大之有。在我看来,大模型是有局限性的,大模型与我们传统的深度学习模型、神经网络,没有什么本质性的变化,只是它在设定神经网络的时候,所涉及到的参数更多。当这个参数大到一定程度的时候,生成的结果出现了某种程度的涌现,使它的结果生成能力和理解人提问题的能力更强了。
大家可以这样理解,按照OpenAI的框架,ChatGPT3.5模型1750万亿的参数,相当于一个26层的神经网络。这个神经网络的模型类似于类脑应用,而1750万亿的参数可以在神经网络中建立一个大空间体系,相当于10000×10000×10000的立体空间,可以几乎把互联网的数据全部灌进去。
因为模型足够大,它可以把人类的认知形成一个知识图谱体系,并像摆放图书一样把不同的认知对应摆放到图书馆里不同的书架上。有了这样的机理,当大模型遇到不同的问题时,它可以调用并判断生成对应的词汇。这时候它不再是是一个单点的模型或者一个行业模型了,而是达到了一种通用认知,达到一种通用涌现的能力。所以我们叫它通用大模型,这是大模型带来的理解和生成的变化。
大模型有一个很大的问题,从深度学习原理和方法来看,大模型的生成结果的准确性只有80%。这是没有办法的,即使GPT5到了100万亿模型的体系,它的正确率还是80%。即使通过大模型的自训练,向上叠加,正确率也不会有多大幅度的提高。当然用传统的模型补充,可以将其准确率优化到90%,但是大模型自身的准确率并不会很高。所以大模型给我们带来的想象力,或者说它真正所谓超越人类的认知能力,并不像想象中那么强。
我给大模型下了一个很重要的结论,我们认为通用智能,也就是AGI是大模型认知的上限,大模型是不可能超越我们人类认知上限的。
此外,大模型是一个生成逻辑,他给出的只是一个最优的词汇梯次聚类,答案和问题直接并无因果。我们得到的东西只是一个“result”,需要鉴别,而是一个“answer”。所以大模型是否能够直接在教育、医疗、司法等严肃领域应用,可能都是一个问题。但是它在辅助决策上人工智能认知研究,是有意义的。在直接生成结果上,如果要商业化、产品化,我们认为还是有很长的路要走的。
对待大模型,拥抱还是防守?
当理解了大模型的局限性,我们再谈第二个问题,生成式人工智能对产业带来的变化。生成式人工智能是传统的数字化、信息化达到了一个新的高度。传统软件的厂商,包括金山也开始讲要用大模型重写办公软件,因为现在的WPS就是离开DOS环境下在Windows环境下重写的。平台性互联网企业,比如美团也认为在大模型的背景下,用语音的入口直接去切入需求,会从根本上改变传统O2O企业的格局。
但是很多消费型、或者是平台型的企业,如果毫无保留地去拥抱大模型,那大模型对行业的反噬能力是很强的,因为这意味着从产业端很轻易地就交出了行业的进入门槛和认知的钥匙。
目前,建筑业是在数字化背景下是保护得是最好的行业。现在建筑业除了一个广联达只能做预算,建筑业的信息化之外没有一家巨头可以切入建筑领域。为什么?因为建筑有设计图、施工图、维修图、规划图、备案图等八张图,所有的图之间相互都是打不通的,政府部门都不是互认的,打通整个建筑的这八张图的成本足够高,所以建筑业才保持了这种竞争主体的多元化。我们通常认为竞争主体的多元化是产业发展活力和动力之源。
所以不妨在拥抱大模型、生成式人工智能的时候想一想,我们所在行业的基础标准、基础竞争优势,在这些都没有建立的情况下,企业要不要无条件地去拥抱数字化与大模型。
科技,或者说数字化与传统产业的融合,是两方演进,一方面从技术方向向实体方向演进,一方面从实体端向技术端演进。企业有没有这个本事和能力从实体端来防住技术端的演进?行业有没有护城河?会不会野蛮人进来这个行业就没有了?在想清楚这些事情之前,不要盲目地进行数字化。
大模型也会带来好处,比如帮助解决现在的人口问题。5月5日中央财经委第一次会议,核心谈了两个问题:第一是如何建设社会主义现代化强国,就是经济高质量发展的问题;第二是讲人口高质量发展的问题。之前广东、浙江大面积用机器换人,工厂进行数字化改造,换机械臂、机械手,解决了用工荒的问题。确实大模型有能力和渠道去替换掉一部分基础的运维人员、开发人员,为解决人口短缺问题带来一定的优势,我们可以尽早地去研究行业怎样解决劳动力的问题。
另外,现在很多视频平台都在卖课,去做知识付费,如果大模型已经解决了搜索知识、运用知识和生成知识的能力,那我们作为劳动参与者和社会认知者,获取知识的能力还有那么重要吗?是了解知识的能力重要,还是创新能力重要,还是组织领导能力重要,到底人的核心竞争力到底是什么?所以大模型再往后发展,知识付费可能会成为一个伪命题。
大模型是一个重要的生产力工具,很多行业都会有被大模型改造的新例子。
大模型之于未来互联网和数字经济
第三部分,讲一下大模型会给未来的数字行业和未来的互联网带来什么样的变化。以前互联网的入口都是鼠标键盘,大模型(不是原来的科大讯飞的语音识别)的出现有可能将语音输入变成互联网的入口。在多轮对话下,让大模型找到最优结果,这是在原来的搜索环境下很难被满足的。那现在互联网导入流量的入口,比如说输入法、各种大屏,不一定会消亡,但至少会有下降的趋势。
大模型需要更高的算力,更强的专用芯片。人工智能专用芯片领域,围绕超算能力的领域,一定是未来的热点。其实很好理解,我们原来的社会形态、经济形态,包括政府治理形态,都是围绕着工业经济展开的。
工业经济的一个典型特征就是整个经济活动围绕着产业链展开。为什么数字经济出来了之后,很多人说实体经济很难?因为数字经济背景下,很多行业是围绕着价值链展开的,围绕价值链被重构,而且带来的变化是一二三产业的边界不是那么清晰了。另外,数字经济使得以往平台型互联网的商业模式发生变化。过去是追求从自身的产业本身去赚钱,但数字经济下,平台本身并不是公司赢利模式和盈利工具人工智能认知研究,很多平台型互联网都是这样。
如果我们认为经济运转的世界是物理世界与数字世界融合,从物理世界的法则为主,逐渐过渡到物理世界和数字世界的融合,数字经济为主的情况下,那在此过程中数字经济需要什么?需要巨大的算力,来维持这种运算,所以我们持续看好芯片和算力的领域。同时,我们也看好传感器,因为传感器是能够打通物理世界跟数字世界连接的新的赛道。
随着大模型和AIGC带来的应用,我们对行业自身的治理能力、对整个数字经济背景下的综合安全和治理能力要求更高了,而且这种治理能力不单单是规则与软件能够满足的。要防住大模型带来的安全问题,背后就需要更大的模型。所以未来在安全防护领域,肯定又是一场更大的硬件体量的对比与较量。
发展大模型,不仅是技术问题,更是政治经济问题
第四部分,讲一下政策与路径的问题。我们国家人工智能的发展二十大以后,与十九大相比已经发生了很大的变化。十九大时,提出经济高质量发展是纲,供给侧改革是主线;二十大以后国际环境剧变,二十大提出来的是构建国内统一大市场,国际国内双循环,是从需求侧来构建整个产业体系与经济体系,这是一个质的变化。需求侧更多相对应问题的着力点是实体经济,这是带来很大变化的。
大模型,包括人工智能的问题,从中央的判断来看,是赢得全球竞争主动权的重要战略抓手,是推动我国科技跨越发展,产业化优化升级,生产力总体跃升的重要战略资源。
二十大报告谈产业问题的时候,将人工智能从新一代信息技术中单独提出。所以从政策上来看,发展人工智能、大模型,不仅仅是技术问题与产业问题,还是一个国家经济核心竞争力的问题,从更深远上看,更是一个政治问题,大家要从更高的角度来认识这个问题。
数字世界要有实体映射,数字经济要着眼于实体经济
未来整个数字经济领域,或者说由大模型带来的智能领域,会往哪里走有哪些方向的变化?近期有一个非常重要的新闻,中银国际在香港通过以太网发行了2亿的数字人民币,香港现在是全球第一个做Web3.0的试点地区,我们嗅到国内离开放公域链的路已经不会太远了,这是未来国内价值互联网开放的一个重要的信号。
还有一个重要的变化是数据价值化的问题。现在我们的财税都是锚定土地与钢筋水泥,中美都需要从各自的货币困境当中走出来。很多人说数字经济是新的一轮产业革命,我们现在认可数据价值化的问题,只是针对数据价值化我们还没有给出一套完整而有效的方法论。
如果抖音有300万粉丝,发一条广告有10万块钱,1000万粉丝发一条广告就有50万,这是大家认可的。那么,当有一天数字资产能够完成真正资本化对价的时候,那也就是未来我们国家从土地财税当中走出来的时候,所以数据价值化是未来数字经济要面对最核心的问题,数据价值化之后就真正解决了数字资产作为财税之矛的问题。
纯数字原生的东西,目前来看是没有资产价值的。如果公域链开放,Web3.0试点成功,后面有一套元宇宙的方法论,元宇宙映射的本体一定是有实体的。但在现在的环境下,不是简单几个硬件设备就是元宇宙了,我们进入元宇宙社会的方法论才刚刚建立,但拥抱元宇宙的手段、产品连1%的路径都没有,我们认为现在元宇宙出来的绝大多数东西都会死在沙滩上。
最后我想说,即使数字经济给我们带来那么广阔的前景,但未来数字经济、生成式人工智能的着眼点,依旧在实体经济上。从实体经济去着眼数字世界的发展,对社会带来个变化、动荡、影响、代价是最小的,我们做了那么多事情,希望大家的关注点依旧放在实体经济上。大模型带来的AIGC变化,只是一个开始,关于数字化带来的商业变革、关于未来数字化带来的价值互联网的变革,还有很多话题值得我们继续深入讨论。