人工智能芯片架构-国内大模型企业对人工智能算力的“饥渴”
“我们迫切地需要算力。”袁辉对第一财经记者说。
袁辉是小i集团董事局主席兼CEO,该公司最近推出了自己的大模型。ChatGPT4之后,当下的中国和美国已成为沸腾的大模型竞技场,算力短缺也变得异常突出。袁辉喊出了国内国际大模型企业对人工智能算力的“饥渴”。
大模型是人工智能发展的一个突出场景。人工智能在今天已经逐步渗透到千行百业,它既能提高工业产品的质检准确率,也更好的处理自动驾驶汽车所收集的激光雷达影像。不少企业界人士认为,人工智能可能开启新一轮的工业革命。而这需要源源不断地,强大而无处不在的算力支撑。
“AI发展是一个黎明时期,尽管我们以惊人速度前进,仍然追赶不上数据的产生和对AI的需求。所以我相信对计算能力的需求,将会是未来十年对所有人的挑战。”AMD全球副总裁唐晓蕾对第一财经记者说。
大模型的算力短缺
6月29日,小i集团官宣杀入了大模型赛道。在发布其“华藏”大模型时,袁辉称这是一款具备“可控、可定制、可交付”的核心特征的产品。
OpenAI公司推出ChatGPT4产品后,当下的中国和美国,以人工智能为基础的大模型已经成为人声鼎沸的竞技场。全球接近170款大模型,近半数在中国。
在过去短短的一个月内,多家中国企业发布了大模型的最新进展。6月9日,科大讯飞在安徽合肥发布了星火认知大模型1.5版本;6月9日,新华三推出私域大模型百业灵犀LinSeer; 6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”。
算力的发展是大模型技术突破的一项前提条件。
“大模型之所以在当下衍生,恰恰因为算力在过去有了比较大的进步,大模型的核心技术并不是今天被发明,包括AlphaGo的出现都是因为算力、数据和算法三个维度的叠加,才涌现出的新结果。”袁辉表示。
没有人能确定多少家大模型企业最终存活下来,成为服务千行百业的水电一样的基础设施。但大模型的狂飙突进已经带来了对算力需求的急剧膨胀。人工智能算力的短缺,对于中国的科技企业尤其明显。
“英伟达最先进的芯片够我们用了吗?很显然不够用,你把它所有生产量加一起也不够用。”袁辉对第一财经记者表示。
英伟达是一家炙手可热的算力提供商。它早期开发的图形处理芯片GPU主要是用于游戏产业,这种芯片有别于传统上的通用型CPU,GPU以并行的算力处理游戏中的图像。它的这一特质后来被发现尤其适合用于人工智能所需的高并发计算。尽管人工智能大模型有时候会一本正经的胡说八道,但它也已经学会了写诗、谱曲,回答数学问题。每一行诗,每一道数学题的运算,都需要算力的支持。
ChatGPT的训练过程号称使用了上万张英伟达GPU,它的成本以亿美元计。当科技企业纷纷仿效推出大模型的时候,英伟达代表性的GPU已经一卡难求。OpenAI的CEO Sam Altman也表示紧缺的GPU人工智能芯片架构,一定程度上影响了该企业业务的开展。
近期参与 MWC上海世界移动通信大会的联想集团、新华三切身感受到了AI服务器的需求旺盛。新华三集团副总裁、运营商事业部总经理何宁对第一财经记者表示,今年出现这个情况,一定程度上是由于AIGC大模型的发展,不少企业一拥而上带来的需求井喷。。
英伟达并非提供人工智能算力的唯一一家公司。有别于英伟达,英特尔、AMD以及高通等芯片企业,此前以提供通用性CUP为全球所知,它们的产品用于上亿的笔记本电脑、智能手机、平板以及工业设备里。现在它们也在纷纷为人工智能场景开发芯片。
谈到近期的GPU供需缺口,唐晓蕾对第一财经表示:“这次缺货首先意味着需求增长,第二意味着备货不足。短缺同时揭示了芯片生产的复杂度,不能做到有需求就能马上生产。”
“未来十年对所有人的挑战”
在人工智能的浪潮里,ChatGPT是最高处的那朵浪花。在这之前,人工智能其实已经开始渗透到各行各业,甚至是普通人的生活里。
汽车产业在美国、中国、日本以及德国等主要经济体中都占据举足轻重的地位,这个产业也在经历百年未见的变局,新能源化、电动化以及互联化席卷而来。
“汽车正在经历从机械到电子再到智能的巨大变革过程。无论是新能源汽车还是传统汽车,为了提供更好的体验,汽车行业与半导体公司正在产生前所未有的紧密耦合以满足发展所需的更强算力。”唐晓蕾对第一财经记者表示:“这个融合过程是数据驱动的。”
传统的燃油汽车一般可搭载五百颗左右的芯片,这些芯片可用于控制车门、天窗以及娱乐交互系统等。而新能源汽车的电子化程度更高人工智能芯片架构,一辆典型的新能源汽车可搭载1200颗左右的芯片,而且这些芯片的性能要求越来越高,因其需要实时的处理摄像头或者激光雷达成像,或者支撑一套强大的人车互动系统。
汽车技术向前演进,它越来越像奔跑在四个轮子上的计算机。单是实现自动驾驶功能,就已经不是目前的算力水平可满足。
普通人所使用的手机性能不断提升,无处不在的通信基础设施也在发生日新月异的变化。新华三是三大运营商的基础设备提供商,何宁表示,新华三的目标是围绕运营商骨干网、城域网和5G承载网三大场景,推动产业进入“高算力”时代。
“CT和IT的融合趋势已经非常明显。联想跟联通在去年一年就有50个大项目,包括智慧城市、智慧教育等战略合作。”联想集团执行副总裁兼中国区总裁刘军在MWC展会上表示,这其中关键的一点也是算力,“国家现在对三大运营商的要求,也是要搭建整个中国的算力网络,希望未来的算力能够像水电一样。”他认为未来算力是相融合的,算力既来自于云端,又可来自于边缘端和智能终端。
传统上,联想集团更为人所知的是其PC业务,去年它在全球销售了1751万台笔记本电脑,Thinkpad品牌一直受商务人士所青睐。但联想集团越来越向基础设施服务商转型,其信息基础设施业务和方案服务两大业务快速成长,在2022财年营收占比达到了40%。在今年的MWC大会,它搭建了全场最大的展馆,更多的展示的是其服务器等基础设施产品,而非笔记本电脑。
“总的来说,我们非常坚信人工智能现在是一个大范式革命,我们觉得这是近20年最重大的一次科技突破。所有的这些AI的应用都要基于基础算力。”联想集团副总裁宋春雨接受媒体采访时说。而联想集团越来越发展为一家“卖算力的公司”。
算力需求无处不在,算力供给相对有限。
“我们迫切地需要算力”,袁辉认为,人工智能算力的短缺会持续相当长的时间,而且算力短缺又与能源问题交织在一起,令问题复杂化。
“我相信对计算能力的需求,将会是未来十年对所有人的挑战。”唐晓蕾对第一财经记者表示:“这不仅涉及对能源、算力的需求,还关系到整个环境改变的需求。这是一种大势,跟以前不一样。”
浪潮里的机会
今年五月,联想集团与寒武纪进行了一场算力碰头会。
这场会议的发起人是联想集团CEO杨元庆,他邀请请寒武纪CEO 陈天石到联想集团的最高执委会,讲解AI算力网络带来的产业变局。参与这场会议的包括了杨元庆以及联想核心高管、业务线管理干部。
联想集团之前的芯片或者算力提供商包括了美国的大厂比如英特尔、英伟达等。这场技术布道会后,刘军拍板决定与寒武纪进行算力战略合作。
寒武纪成立于2016年,致力于开发人工智能领域的核心处理器芯片。虽然已经上市,但相对英特尔、英伟达等芯片企业,寒武纪在营收和市值上都只能算是初成长。
算力需求的爆发,给予寒武纪这样的初创企业以历史性的机遇。近年来国内的政策和资本都在硬核科技倾斜,资本市场敞开了大门,投资机构和算力相关初创企业之间的互动也越来越深入。
智能化成为不少投资机构的布局主线。据宋春雨介绍,联想创投围绕这条主线投资了接近100企业,包括了人工智能处理器的寒武纪,GPU赛道上的摩尔线程,为自动驾驶提供算力的黑芝麻智能等。
智能化社会的到来,需要根深叶茂的行业巨擘如英特尔、英伟达以及高通、AMD等提供源源不断的算力,也为新兴企业的发展提供成长的土壤。尤其考虑到,美国近年对其芯片企业的在华发展设置多重障碍,中国本土企业也越来越多的考虑备份方案,开始为初创企业提供订单和发展机会。
“大家真正重视集成电路了,各种初创公司,包括各种人才都涌入进来了。”华大半导体战略规划部总经理王辉对第一财经记者表示。在此前召开的第18届长三角汽车电子产业链高峰论坛上,王辉以MCU(微控制单元)为例称,现在国内企业在中低端的MCU领域“已经很能打了”。
中低端的MCU往往不需要最先进的制程工艺。在消费端、在部分工业场景里,国内企业的产品已经具备竞争力。王辉表示,现在在啃的硬骨头是车规级的MCU,这一市场目前由英飞凌、ST意法、瑞萨以及恩智浦等几家企业主导。“其实我觉得只要不涉及先进工艺的,以国内企业的奋斗精神来说,赶上甚至超越是迟早的事情。”
人工智能的发展重塑千行百业,浪潮会托起许多大船,也可能击沉巨轮。它的发展现在只是“揭开了神秘舞台的一角,我们不知道布景,但能感受到大幕正在徐徐拉开。”唐晓蕾对第一财经说。