人工智能图像识别技术-图像灰度识别
第16期(总第553期)2023-4-4
按:我国人工智能已取得了举世瞩目成就,已经处于世界第一梯队。算法、应用、硬件、数字基础设施、数据、算力,是人工智能领域的“六架马车”,世界范围内,我国在数字基础设施、人工智能应用、数据生产、算力建设等方面优势明显,但同时,相比美国,我国存在诸如核心算法及专利较少、硬件研发能力薄弱、顶尖人才流失较为严重等问题。我国应基于国情,规划人工智能未来发展路线,走出一条特色发展之路。
当前,人工智能(AI)已成为大国竞争的主战场,我国已于2017年发布《新一代人工智能发展规划》,为我国未来人工智能的发展指明了方向、提出了要求。《新一代人工智能发展规划》提出我国到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心的战略目标。当前我国在人工智能领域虽然已取得显著成就,进入世界人工智能领域第一梯队,但是和美国相比,我国硬件、研发等领域依然存在很大差距。
一、关于我国人工智能国际竞争力的一些基本判断
一是得益于国家大力支持,我国人工智能得以在短时间内迅速崛起
虽然我国人工智能技术贮备不多,发展历史较短,但是我国迅速抓住了人工智能发展机遇,在制度保障、资源投入、人才培养等方面给予充分支持,使我国在较短时间内成功进入世界人工智能第一阵营。如:
当前,我国人工智能论文、专利等均已经超过或赶超美国,在人脸识别、语音视别、自然语言翻译、无人机等技术应用领域已经开始引领世界。
二是我国已进入世界人工智能第一阵营,成为仅次于美国的人工智能大国
2020年,我国在人工智能领域的论文发表总量、引用总量均已超过美国,成功登顶世界。2004年,我国人工智能论文量曾首次超过美国,此后于2017年再次超越美国居世界首位,并延续至今。根据斯坦福大学发布的报告《人工智能索引报告2021》(Artificial Intelligence Index Report 2021),2019年,中国在世界人工智能出版物中所占的份额为22.4%,超过同期欧盟的16.4%及美国的14.6%。不仅在数量上,2020年我国人工智能论文引用量也第一次超越美国(在过去十年中,美国的人工智能会议论文被引用次数一直显著多于中国),占世界人工智能论文总引用量的20.7%,而美国这一比例为19.8%[1](见图1)。
从国际人工智能专利层面看,根据英国产权办公室2019年发布的报告《人工智能:英国及全球人工智能专利概览》,1998-2017年间,美国和中国是世界范围内最大的人工智能专利申请国,其中,美国的总人工智能专利申请量接近50000项,而中国则超过了40000项,远超日本(约15000项)、韩国(约7000项)、德国(约5000项)、英国(约2000项)、俄罗斯(约1500项)、法国(约1000项)等(见图2)。
约从2015年起,人工智能专利的增加主要是由中国和美国所推动,虽然美国是人工智能专利申请总量最多的国家,但中国最近的增长幅度更大,自2014年以来每年的数字已超过美国[2]。
三是我国人工智能技术领域存在大而不强、人才流失等现象
虽然我国在人工智能论文数量、引用量、专利总量等方面已经居于世界前列,但大而不强、影响力弱等现象非常突出。如在更高质量的人工智能顶会论文引用量层面看,美国在过去21年中一直处于领先地位,2020年,美国以40.1%的总引用率位居榜首,其次是中国(11.8%)和欧盟(10.9%)[3]。2013-2017年间,世界人工智能论文生产量最多的科研组织均来自于美国(卡内基梅隆大学、MIT、微软、IBM、斯坦福大学),且其论文影响力平均值达4.0,而中国仅为1.5[4]。而在专利影响力方面,我国与美国也存在很大差距,根据英国产权办公室发布的报告《人工智能:英国及全球人工智能专利概览》,中国的大部分专利申请都是在中国国内单独公布,只有19%的专利在其他国家有同等申请,而美国这一比例则达到53%,英国更高达到88%。此外,我国顶尖人工智能人才被美国“虹吸”现象严重,在人工智能人才吸引力方面,我国依然存在非常大的差距。
二、我国在世界人工智能领域的竞争优势
相比美国、欧盟,中国在人工智能应用及支撑性基础设施方面处于世界领先地位,中国人工智能技术的应用领域广泛、应用场景多样,数字基础设施完善程度远超其它国家;同时,我国也是世界人工智能应用与数据生产、流通第一大国,各类型数据的生产、应用、流通更是远超世界其它国家,从而形成了我国在世界人工智能领域较为突出的比较竞争优势。
一是已建成世界最为完善的数字基础设施体系
人工智能技术的发展,需要完善的数字基础设施建设的支持,从而为数字化生活、数字化经济提供基本支撑,而我国近年通过政策支持,已经形成了较为完善的数字基础设施,为我国人工智能技术的应用与发展奠定了基础。根据中国信通院发布的《全球数字经济白皮书(2022年)》报告,2021年底,我国数字经济规模达7.1万亿美元,位居世界第二。根据国务院发布的《“十四五”数字经济发展规划》,我国已建成全球规模最大的光纤和第四代移动通信(4G)网络、第五代移动通信(5G)网络系统;中国网民规模达9.89亿,互联网普及率70.4%,移动宽带用户普及率达到108%,互联网协议第六版(IPv6)活跃用户数达到4.6亿[5]。
二是已形成全球范围内最为庞大的数字技术应用体系
我国人口众多、企业重视人工智能技术应用,从而形成了发达的数字市场经济,当前我国已成为全球最大网络零售市场和最大移动支付交易市场,人工智能应用范围及使用强度世界领先。2018年中国约有32%的企业使用了人工智能相关技术,超过美国的22%和欧盟的18%,我国的语音识别、图像识别、大数据处理等人工智能技术已在商业、交通、金融、医疗、教育等领域广泛普及[6]。2019年,我国数字经济增加值占比近40%,成为全球最大网络零售市场和最大移动支付交易市场。根据中国信息通信研究院2021年发布的《全球数字经济白皮书》,2020年,我国电子商务交易规模达37.21万亿元,全国网上零售额为11.76万亿元。同时,在线教育、在线医疗、远程办公等数字服务业蓬勃发展,截止2020年底,用户规模分别达3.42亿、2.15亿和3.46亿。
三是我国是世界最大的数据生产与流通国
我国数据生产量远超美欧,是世界第一数据生产大国。2018年我国使用移动支付的个人数量达5300万人人工智能图像识别技术,远超美国的550万人及欧盟的45万人。从物联网数据看,2018年,中国的物联网数据量为1520万TB,是美国690万TB、欧盟535万TB的近三倍;中国在电子健康记录、遗传数据等方面均居世界首位,我国数据规模预计2025年将增至48.6ZB,成为数据量最大、类型最丰富的国家之一[7]。
四是算力建设稳步推进,并逐渐超过美国成为世界算力最强国
算力对人工智能至关重要,是其运行的基础“能源”来源,事关其整体运行能力,算力作为数字经济时代的关键生产力要素,如计算力指数平均每提高1点,数字经济和GDP将分别增长3.5‰和1.8‰。2022年3月17日,IDC、浪潮信息、清华大学全球产业研究院联合发布《2021-2022全球计算力指数评估报告》显示,过去5年,中国人工智能算力首次超越美国成为全球第一,人工智能服务器支出规模同比增长44.5%,在15个国家人工智能算力支出的增长中,中国贡献了近60%。过去五年,我国总算力水平增幅程度也远超其他国家,达13.5%,而巴西和马来西亚算力增速均为8.4%,俄罗斯算力增速为8.2%,美国为5%[8]。
三、我国在世界人工智能领域的相对劣势
一是顶级研究人员缺乏,保有量远落后于美国
根据麦克罗波洛智库(MacroPolo)发布的报告《全球人工智能人才追踪》(The Global AI Talent Tracker),2019年,全球近59%的顶级人工智能研究人员(top-tier AI researchers)为美国大学和公司工作,而中国仅为11%。麦肯锡咨询公司高级数据分析师伊桑·巴纳吉(Ishan Banerjee)也指出,美国科研机构雇佣了世界近60%的顶级人工智能研究人员,是中国(10.6%)和欧洲(10.2%)的近六倍(见图3)[9]。
《全球人工智能人才追踪》报告分析了2019年在国际人工智能顶会“神经信息处理系统进展大会”(NeurIPS)上做口头陈述的论文作者情况(口头陈述是NeurIPS最负盛名的论文类别,2019年的接受率为0.5%),结果发现,来自美国的口头陈述学者占大会口头陈述学者总数的65%,加拿大学者占10%居第二位,此后分别为法国8%居第三位、英国6%居第四位、以色列5%居第五位、荷兰3%居第六位,而中国学者仅仅是包含在剩余的4%之内。
二是面临严峻的来自美国的“人才虹吸”压力
美国的领先地位建立在吸引国际人才的基础之上,如约超过三分之二在美国工作的顶级人工智能研究人员,是在其他国家获得本科学位。根据斯坦福大学2021年发布的《2021人工智能指数报告》,2019年北美人工智能新入学博士中,国际学生占比达64.3%,且这些国际学生博士毕业后,81.8%留在美国[10]。2020年,《华尔街日报》北京分社记者保罗·莫祖尔(Paul Mozur)撰文称,在美国学习人工智能的中国公民往往会留在美国工作,他将中国人才称为“美国人工智能领域的秘密武器。”[11]根据《全球人工智能人才追踪》报告,从世界顶级人工智能研究人员的来源地看,约29%来自于中国,而美国仅为20%。但是,中国却经历了顶级人工智能研究人员的大量流失窘境,中国的顶级人工智能研究人员,只有34%选择留在中国工作,而大约56%却前往美国工作(见图4)。
特别是在美国攻读人工智能博士学位的中国留学生,他们在美国完成人工智能博士学位后,88%会选择留在美国工作,只有10%返回中国(见图5)。
三是核心专利严重缺位,人工智能产业生态面临安全隐患
中国在人工智能核心算法方面面临缺位问题,底层核心算法(如Dropout等)大部分掌握在美国等手中,制约着我国整个人工智能产业的安全与可持续发展。如在人工智能核心专利层面,1960年至2018年间,美国向美国专利商标局所提交的高被引专利族群达28031,而中国仅为691[12]。特别是谷歌已持续对基础人工智能算法专利进行广泛布局,并构建完善产业生态(据赛迪智库统计,2016年至2018年间谷歌共发布专利项为1659,且以发明专利为主)。这一状况严重影响了中国人工智能产业安全,如2019年谷歌提出作为当前深度学习最为基础性的算法Dropout的专利申请正式生效,引起行业震动。
四是过度依赖国外算法,缺乏有影响力的人工智能开源软件库
虽然在一些专用算法领域,我国已有所突破,如科大讯飞、百度、“天猫精灵”等均形成了一定的核心算法研究能力,但整体来讲,我国大部分人工智能企业(特别是中小型人工智能应用类企业)主要依赖国外开源算法及软件。一个典型例子是:2021年,在全球持续蛋白质结构预测竞赛CAMEO中,来自中国华深智药的HeliXonAI,其平均lDDT预测精确度达到了84.0(之前AlphaFold2模型预测精确度为81.9),然而,HeliXonAI的核心算法是基于开源的AlphaFold2。根据斯坦福大学2021年发布的《2021人工智能指数报告》,2020年世界最受欢迎的人工智能开源软件,主要是美国所研发的算法,如Google的TensorFlow处于绝对领先地位,其次还包括谷歌的另一款开源人工智能软件Keras,Facebook创建的PyTorch等(见图6)。
五是人工智能硬件领域大幅落后于世界,难以提供足够的发展支撑
我国在人工智能硬件领域(设计、材料、制造等)差距甚大,关键性半导体材料及生产工艺技术的缺乏,如大规模基础性的底层人工智能芯片(如GPU、FPGA、TPU)设计与制造基本处于空白或尚处于发展初期;专用型或定制性人工智能芯片已有进展(华为昇腾910、阿里含光800、地平线自动驾驶芯片征程3、云天励飞视觉分析芯片等),但性能及制造仍是短板。更为重要的是,高端智能芯片的生产与加工等与美、日、韩依然存在差距,如当前我国电动汽车智能芯片主要依赖于英伟达、高通等美国企业。此外,用于提高人工智能硬件的底层数据库(如NVIDIA优化GPU的cuDNN等)国内鲜有涉及。
四、政策建议
一是启动“人工智能基础层技术战略贮备计划”,确保人工智能产业生态整体安全
当前条件下,我国应采取“扬长补短”模式,重视补足短板人工智能图像识别技术,研究方向“下沉”——由追求单纯的应用领先转向底层核心技术攻克,维护我国人工智能产业生态的稳定性与安全性。我国应适时启动“人工智能基础层技术战略贮备计划”,由工信部等部门进行专项资助,如“核心算法专项计划”“先进智能半导体制造工艺计划”“人工智能基础架构创新与推广计划”等,并整合各个社会力量,组建攻克人工智能领域“卡脖子”问题的“国家队”。此外,还可以举办类似于美国国防部高级研究计划局(DARPA)“大挑战”那样的、面向大学或全社会的竞赛项目,如“核心算法创新大赛”等。
二是加快培养本土人工智能人才,推动顶尖人才回流,并积极构建国际人才培养新渠道
人工智能人才,特别是顶尖人工智能人才是中美人工智能竞争的最重要一环,为应对美国对中国人工智能顶尖人才的“虹吸效应”,一方面,我国应加快本土人工智能人才的培养,加快大学人工智能研究院、专业性人工智能研究机构建设步伐,或是大学、科研机构与企业共同培养人工智能人才,为本土人工智能人才培养提供充足平台;另一方面,应加快制定、推进专项的“国际人工智能人才引进计划”,设立“人才引进绿色通道”,积极与美国等争取、争夺与人工智能相关的顶尖人才,特别是鼓励本国人才回流;此外,积极拓展国际人工智能人才培养渠道,鼓励企业在与中国关系较为友好、且在数学等领域具有较好基础的国家(如俄罗斯等)设立人工智能研发机构,形成人工智能人才培养的国际化局面,积极吸纳国际智力资源为我所用。
三是积极构建中国特色的人工智能伦理治理体系,确保负责任人工智能技术的发展
统筹发展与安全,找好发展与安全的平衡点,既不能因为规制过度而阻碍技术创新应用,也不能因为规制不当而引发不可逆转的风险。在治理路径上,坚持从技术、法律和伦理三方面共同推动符合人工智能阶段性发展特征的规制体系,特别是要加强人工智能安全、隐私保护等方面的技术研发,强化伦理治理和风险防范的技术支撑,实现“以技制技”。