人工智能 训练模型-AI大模型“百花齐放”还是“集中力量”?
中青报·中青网记者 王林 王海涵
“百模大战”来了。今年以来,AI(人工智能)大模型产品层出不穷。5月6日,科大讯飞发布星火认知大模型,并发布其在教育、办公、汽车、数字员工等行业的应用成果。此前,百度率先发布文心一言,阿里紧跟其后官宣通义千问,商谈科技、云知声、医联等科技公司也宣布发布或即将发布各自的AI大模型产品,清华大学、北京智源人工智能研究院、上海人工智能实验室等科研院所也发布了各自的AI大模型成果。
在此之前,中共中央政治局于4月28日召开会议,分析研究当前经济形势和经济工作,提出要重视通用人工智能发展,营造创新生态,重视防范风险。
据不完全统计,目前国内科技“大厂”、创业公司、科研院所等发布的AI大模型已超过30个,还有不少正在研发当中。与数量同步增长的是争议,有不少业内人士关心:短短几个月就做出来的AI预训练大模型,真实能力究竟如何?在下一代人工智能竞争日趋激烈的当下,AI大模型领域应该“百花齐放”还是“集中力量”?算力、数据等技术型瓶颈如何突破?面对AI大模型领域的国际竞争的压力,怎么发挥中国的比较优势?
大模型真实能力如何?业内人士:急需评测
尽管此前已有不少企业探索预训练AI大模型,但这轮“百模大战”还是在OpenAI公司发布ChatGPT之后,才掀起高潮。3月份,百度发布了大语言模型“文心一言”;4月份,阿里的“通义千问”开始企业内测;商汤科技带来了“商量SenseChat”,360也开启了“360智脑”企业内测。此外,腾讯、京东、字节跳动等国内科技“大厂”也纷纷宣布了在类ChatGPT产品或AI大模型领域的布局。
根据民生证券相关研报的统计,目前国内至少已经有30多家大模型亮相,出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司,有的大模型的参数规模已经接近,甚至超越ChatGPT的规模(上千亿条)。依托这些大模型推出的类ChatGPT产品,主打的能力包括对话问答、文本及代码生成等等。
尽管有了这么多AI大模型产品,但无论是专业人士还是普通用户仍有迷思:怎么判断AI大模型的真正能力?这么多AI大模型和类GPT产品,究竟谁有真正的实力?
5月6日,科大讯飞董事长刘庆峰在接受记者采访时谈到:“对于通用大模型,中国这么多公司去做,我们需要一个相对客观的系统性的评价方法。我们要向OpenAI学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。”
据刘庆峰透露,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。希望通过科学的评测体系推动大模型的发展。
“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”他认为,应该从7个维度衡量AI大模型产品是否达成通用人工智能(AGI):文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
“喂养”大模型,未必数据越多越好
一般认为,算法、算力、数据是AI大模型研发中必不可少的基础要素,也是制约大模型成果水平的关键因素。在这一轮“百模大战”中,不少企业都宣称其推出的AI大模型数据量超大、参数达千亿条,有的比肩甚至超过年初发布的ChatGPT的参数规模。
要训练一个AI大模型,是不是需要数据越多越好?对此人工智能 训练模型,ChatGPT之父、OpenAI创始人萨姆·奥特曼最近在接受采访时表示,大语言模型的规模已接近极限,并非越大越好;大模型发展不应一味追求参数数量,未来大模型或以多个小模型相互协作的方式运行。
刘庆峰也有类似的感觉。他认为,未来大模型的发展方向将不是一味地增加更大的算力和更大的模型,而是把各个子模型联动起来,并通过提升算法来优化其能力。这一次认知大模型的越阡式发展主要特点是,通过多种类型数据进行学习和训练,数据来自于包括语音、图片、图像等素材。
科大讯飞方面认为,在算力提升遭遇瓶颈,训练数据数量、质量有限的情况下,算法在大模型研发中的关键作用愈加凸显。算法优势是讯飞星火大模型的核心竞争力,能够弥补目前国内大模型研究在算力和数据方面的不足。相关负责人指出,现阶段大模型的基础理论已十分明晰,更像是一种系统性的复杂工程,“如何将其中的每一个环节‘做透’,通过算法的优化,将每一部分组合在一起发挥更大作用将是接下来发展重点。”
对于训练AI大模型的数据,科大讯飞研究院院长刘聪认为当下能够使用的中文训练数据,无论是数量还是质量都与英文数据相比存在一定差距。据他介绍,科大讯飞星火大模型采取的是中英文混合训练模式,让英文数据与中文数据相互补充、验证,一定程度上弥补单语种数据集的不足。
另一个让业内担忧的问题是AI大模型的污点数据。对此,刘庆峰呼吁应该提升对数据的清洗能力。“数据本身它是有导向性的,需要把那些‘脏数据’清洗掉。(因为)有的是决定影响性能效果的,有的是影响价值导向的。”
算力瓶颈如何突破?
对于国产AI大模型而言,算力是另一个关键问题。近年来,随着“东数西算”、算网融合等发展,全国算力网络正在加速建设,算力正在成为AI竞争的新焦点,也成为数字经济发展的新引擎。我国算力产业规模排名全球第二,去年增长率近30%。
尽管如此,但在日趋激烈的竞争中,各家企业对算力的巨大需求仍然难以满足。更有不少业内人士直言:缺乏强大的芯片等算力支持,是制约我国AI大模型发展的一大瓶颈。
AI大模型研究中人工智能 训练模型,算力是很重要但并非决定性因素。科大讯飞方面也指出,“算力当然要有,但并非像大家认为的,必须要有上万块GPU才可以做。我们可以通过算法的提升来优化对算力的需求。”
作为企业家,刘庆峰观察到中美之间存在算力差距,这确实会让中国在国际AI大模型研发的竞争中处于劣势。但目前国内的经验证明,中国企业可以在算力更差、模型更小的情况下,做出许多方面表现不输于ChatGPT的AI大模型产品。“在很多维度上我们已经看到了,这是一个机会。”
刘庆峰透露,在国产算力的支持下,星火大模型还将在今年6月、10月迎来新的技术升级计划。“面对各种可能的风险,我们已有所准备,目前的升级计划不会受到影响。”
当前AI算力竞争的主战场之一在云计算。中国工程院院士郑纬民最近在2023移动云大会上指出,国内云计算产业存在三方面突出问题:从核心技术的角度来看,云计算的硬件技术自主可控性仍是薄弱环节;从生态构建角度来看,云计算的互操作性成为影响构建统一生态和发展创新的瓶颈;从行业应用的角度来看,公有云上行业应用类型单一是突出问题。
郑纬民院士也提出了相关建议:加大信创工程的支持力度,为自主可控云技术提供市场空间;持续发展云计算互操作技术,推动云际互操作接口标准化,建立产业发展基金,解决云计算的互操作问题;持续激励企业数字化转型,激励国有企业使用公有云,推进建设公共科学数据云服务,丰富公有云行业应用类型。