当前位置: 主页 > 技术方案

人工智能语音系统原理-梅赛德斯-奔驰车载语音助手接入ChatGPT,人工智能带来怎样的改变

发布时间:2023-06-25 09:06   浏览次数:次   作者:佚名

6月16日,梅赛德斯-奔驰官方宣布将车载语音助手接入ChatGPT。即日起,超90万美国客户可通过Mercedes me手机应用或语音“Hey,Mercedes”参与MBUX智能人机交互系统测试计划。

汽车是大模型最大的交互应用场景,这是ChatGPT第一次应用在汽车环境中。这一测试的结果将被用于进一步完善语音助手,为更多市场的大型语言模型提供参考,因为ChatGPT的接入,智能汽车操作系统也将被重塑。

智能语音外呼系统_智能语音客服系统_人工智能语音系统原理

除了奔驰,众多企业也在关注和探索大模型在汽车上的应用,包括特斯拉、英伟达、百度、阿里等。人工智能和汽车的结合是国内外的迫切发展方向,没有公司会愿意在人工智能引领的又一次革新中掉队。

而在人人都谈论AI的今天,我们也想简单聊聊人工智能将会对汽车行业带来怎样的改变。

更懂你的智能座舱

大模型的出现给人工智能的发展带来了新的机遇和挑战,也为汽车行业提供了新的可能性,主要的应用场景包括智能座舱和智能驾驶

汽车智能座舱是指集成了多种智能化功能和服务的汽车内部空间,它可以通过多模态的人车交互方式,为驾乘者提供安全、舒适、便捷、娱乐的出行体验。

人工智能大模型在汽车智能座舱上的应用,首先体现在语音交互方面。

语音交互是智能座舱中最重要的功能之一,它可以让驾乘者通过自然语言与汽车进行沟通和控制,提高出行的便捷性和安全性。

根据汽车智能化研究机构汽势科技的数据,2023年上海车展上,搭载语音交互功能的车型占比达到了95%,其中奔驰的语音交互搭载率排名第一。

智能语音外呼系统_智能语音客服系统_人工智能语音系统原理

而奔驰之所以能在语音交互方面领先,与其采用了ChatGPT技术有关。奔驰将ChatGPT整合到其MBUX智能人机交互系统中,为车主提供了全新的语音助手体验。该系统将支持更动态的对话,它不仅可以准确理解车主的语音命令,还可以与车主进行交互式对话。

其次便是图像分析方面。图像大模型可以为汽车智能座舱提供面部识别、情绪分析、AR相机等服务,让驾乘者可以通过图像与汽车进行交互和娱乐。例如,商汤科技发布的图片生成模型“秒画SenseMirage”,就可以根据驾乘者的输入或选择,生成各种风格和主题的图片。

除了语音交互和图像分析之外,3D内容大模型也可以为汽车智能座舱赋能,它可以为其提供3D导航等服务。

智能语音外呼系统_智能语音客服系统_人工智能语音系统原理

总之,人工智能大模型在汽车智能座舱上的应用,可以让汽车具有更强的感知、理解、生成、交互等能力,从而为驾乘者提供更加智能化、个性化、场景化的出行体验。

这是一场正在发生的交互革命,而这场革命还离不开未来交通行业的另一个重要发展方向——自动驾驶。

自动驾驶再提速

自动驾驶技术是未来交通行业的重要发展方向,而AI是实现自动驾驶技术的关键技术之一。自动驾驶是指通过计算机系统的感知、决策和执行,实现车辆在不同程度上替代人类驾驶者的技术。

根据国际汽车工程师协会(SAE)的标准,自动驾驶可以分为六个级别,从L0到L5,分别代表不同的自动化程度和人机交互方式,L0-L2属于驾驶辅助,L4-L5才算自动驾驶。

而我们目前最高到L3级,即借助人工智能,车辆可以处理所有驾驶任务,但在紧急情况或者其他类似系统故障的情况下,仍需要驾驶员在场。

人工智能语音系统原理_智能语音外呼系统_智能语音客服系统

◉ 自动驾驶L0-L5

L0级,人工驾驶;

L1级,辅助驾驶,是指车辆可以提供部分辅助功能,但仍然需要驾驶员时刻监控周围环境,并随时准备接管车辆;

L2级,部分自动驾驶,是指车辆可以提供多项辅助功能,例如同时具备AIGC和LKA的高级驾驶辅助系统(ADAS);

L3级,有条件自动驾驶人工智能语音系统原理,车辆可以在特定的场景和条件下完成所有的驾驶操作和周围环境监控,但需要在系统要求时由人类提供适当的应答;

智能语音外呼系统_人工智能语音系统原理_智能语音客服系统

L4级,高度自动驾驶,是指车辆可以在特定的场景和条件下(例如无人物流、无人微公交、自主泊车等)完成所有的驾驶操作和周围环境监控,并且不需要人类提供任何应答。此时,车内无需配备安全驾驶员人工智能语音系统原理,但仍然限定道路和环境条件;

L5级,完全自动驾驶,此时的车内无需配备安全驾驶员,也不限定道路和环境条件。

◉ 技术原理

自动驾驶采用计算机自主学习、高精度地图、定位、网络通信和激光雷达等信息技术,在车辆自动行驶过程中,利用环境感知、自动决策和控制等技术,对道路行驶条件、行驶过程中可能遇到的障碍及危险进行有效的控制和避免,并对各种复杂环境和突发状况采取行之有效的措施。它的基本原理包括了感知、决策、控制三方面。

人工智能语音系统原理_智能语音外呼系统_智能语音客服系统

感知是自动驾驶的基础,是实现决策和控制的前提。感知是通过毫米波雷达、激光雷达、摄像头,对车辆周围环境进行精准识别,自主避让前方障碍物,进行自动转向。

决策是指车辆根据感知到的信息,通过智能算法和模型,进行规划和判断,确定合适的工作模式和控制策略,代替人类做出驾驶决策。决策主要依赖于芯片和软件,是自动驾驶的核心,包括路径规划、行为规划、轨迹规划、交互规划等。

人工智能语音系统原理_智能语音客服系统_智能语音外呼系统

控制是自动驾驶的实现,是感知和决策的结果。它是指车辆根据决策输出的指令,通过线控系统或机械系统,对车辆进行相应的操作执行,如转向、加速、减速、制动等。

控制主要包括两个方面:纵向控制和横向控制。前一个控制车辆在行进方向上的速度和加速度,主要涉及油门和制动系统;后一个控制车辆在垂直于行进方向上的位置和角度,主要涉及转向系统。

◉ 应用层面

人工智能的发展显著提高了自主驾驶系统的能力。通过机器学习算法、计算机视觉和传感器融合技术的结合,系统能够理解周围环境并对其做出反应,变得更加可靠、高效和安全。

想要利用人工智能实现彻底改变驾驶方式,主要是看自动驾驶领域的应用层面,包括环境感知、决策规划、学习适应三个重要部分。

自动驾驶车辆结合了摄像头、激光雷达、雷达和其他传感器来收集周围环境的数据。接着,人工智能算法将对这些数据进行处理,以创建详细的环境地图,并识别物体,如行人、其他车辆、红绿灯和路标,决定车辆该如何响应。而类似GDDR6的高速存储器可以支持快速存储和访问数据,实现密集型计算。

而自动驾驶汽车使用人工智能根据从传感器收集的数据能做出实时决策。例如,如果自动驾驶汽车检测到行人横穿马路,它将使用人工智能来确定最佳行动方案,进行减速或停车。

智能语音外呼系统_智能语音客服系统_人工智能语音系统原理

同时,预测建模与监督学习算法能实现预测其他道路使用者的行为,例如行人在特定位置横穿马路和其他车辆变道的可能。这有助于汽车预测潜在的交通问题,并采取适当的行动来避免。

而无监督学习算法可用于识别自动驾驶汽车传感器收集的数据中的异常或意外事件,例如在意外位置横穿道路的行人或突然变道的车辆。

自动驾驶系统还可以利用机器学习和深度学习技术不断优化自身性能。通过不断收集和分析驾驶数据,系统可以学习和适应不同的驾驶场景,改进自己的决策能力和反应速度。

此外,强化学习技术也在自动驾驶领域发挥着重要的作用。通过强化学习,车辆可以在实际驾驶环境中不断试错和学习,优化其驾驶策略和决策能力。

未来驶向何方?

汽车在当代社会是人类出行必不可少的交通工具与社会发展的经济引擎。随着人工智能技术的不断进步,自动驾驶技术将逐渐商业化并进一步普及。

智能语音外呼系统_人工智能语音系统原理_智能语音客服系统

也有一种观点认为,汽车也有望成为智能移动终端的一部分。人工智能和互联网的发展为汽车提供了与其他智能移动终端进行交互的能力。我们的智能生活也会因为汽车的移动私人空间属性,而变得更具有扩展性与独特性。

作为全球市值最高的车企,特斯拉大力推行自动驾驶,势必要将autonomy进行到底。国内百度CEO李彦宏也表示,随时都在发生的正常车祸不是新闻,而自动驾驶的车祸就成了新闻,究其根本原因是无人驾驶还未普及。

当然,智能驾驶产业链的确还需要完善政策、成本、技术、保险等各方面因素存在的问题。但自动驾驶技术的前景一片光明,我们的出行生活也期待变得更加智能与安全。