• 正文
  • 相关推荐
申请入驻 产业图谱

汽车多模态交互研究:L1~L4级座舱的交互进化

1小时前
104
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

佐思汽研发布《2025年中国汽车多模态交互发展研究报告》。该报告全面梳理了汽车座舱可交互模态市场装配情况、多模态交互专利、主流座舱交互方式、2025年上市的重点车型交互方式应用、车企/供应商座舱交互方案,以及多模交互融合趋势等。

一、多模态交互闭环进化:L1~L4智能座舱的渐进进化

根据中国工程学会联合发布的《汽车智能座舱分级与综合评价白皮书》中,智能座舱分级体系可分为L0-L4共五个层级。

图:智能座舱分级体系

来源:佐思汽研《2025年中国汽车多模态交互发展研究报告》

多模态交互能力作为推动座舱智能化的关键,其核心是依靠 AI 大模型与多硬件协同,实现多源交互数据的融合处理,并基于此完成对驾乘者意图的精准理解与场景化反馈,最终达成自然、安全且个性化的人机交互。 目前汽车智能座舱行业整体处于L2级阶段,部分领先厂商向L3级别探索和迈进。

来源:佐思汽研《2025年中国汽车多模态交互发展研究报告》

L2级智能座舱的核心特征是“强感知,弱认知”。L2阶段座舱多模态交互功能实现信号级融合,基于多模态大模型技术,能“理解用户模糊意图”、“多指令同步处理”,执行用户即时、显性指令。当前多数量产智能座舱均能实现。

以理想i6为例,其搭载了最新的 MindGPT-4o 多模态模型,具备超长记忆、超低延迟的理解与响应能力,以及更自然的语言生成水平。支持多模态可见即可说(语音+视觉融合搜索:让不识字的小朋友也可以通过描述视频封面里的内容,选择自己想看的动画片);多模态指代交互(语音+手势:① 语音对物体的指代,发出指令的同时,伸出食指:向左指可控制车窗,即可完成车辆控制。② 语音对人员的指代,同排座位的乘客可以通过手势和语音配合实现对指定人员的语音控制,例如向右指并说“给他打开座椅加热”)。

L3级智能座舱的核心特征是“强感知,强认知”。L3阶段座舱多模态交互功能实现认知级融合,依托大模型能力,座舱系统能综合理解当下所处的完整场景,无需用户发起明确指令,主动发起合理的服务或建议。

L4级智能座舱的核心特征是“全域认知,自主进化”为用户打造“全域智能管家”。L4阶段智能座舱应用将远超工具属性,成为能预测用户未说出口的需求、拥有共同记忆、并为用户调度一切资源的“数字孪生伙伴”。其核心体验是:需求在用户明确感知或表达之前,系统已完成预测、规划并进入执行状态。

二、多模态AI Agent实现懂你所需,预判所想

AI Agent可视作是智能座舱从L2向L4演进过程中,功能得以具体落地的核心执行单元和关键技术架构。通过融合语音、视觉、触觉及情境信息,AI Agent 不仅能“听懂”指令,更能“看懂”环境、“感知”状态,从而将原本离散的座舱功能整合为连贯、主动、个性化的服务流程。

来源:佐思汽研《2025年中国汽车多模态交互发展研究报告》

L2级下的Agent应用可看做“增强版指令执行”,是L2座舱交互能力的极致延伸。基于大模型技术,座舱系统将用户的一句复杂指令,拆解成多个步骤,然后调用不同的Agent工具去执行。例如乘员说:“我累了,帮我买一杯咖啡。”L2级座舱系统的大模型会理解这个复杂指令,然后依次调用:

语音 Agent:实时解析用户需求;

点餐 Agent:根据用户偏好、实时位置、餐厅营业状态推荐最佳选项;

支付 Agent:自动完成无感支付;

配送 Agent:结合车辆导航数据,动态规划送餐时间(如“车到餐至”,确保用户抵达目的地时餐品同步送达)。

当前Agent应用本质上仍然是对用户一个显性、复杂指令的响应与执行。座舱系统没有“主动”做任何事,它只是在更智能地“完成用户交代的任务”。

案例(1):智己汽车发布与斑马智行联合研发的“IM AIOS生态座舱”。该座舱首次将阿里生态服务以AI Agent形式落地,开创“No Touch & No App”的人车交互模式。IM AIOS生态座舱推出的“AI 点餐 Agent”、“AI 票务 Agent”功能让用户仅需通过语音交互即可完成选餐/购票、支付,无需手动操作。

案例(2):2025年8月4日,腾势汽车在品牌发布会上正式推出“车生活 Agent”智能服务系统,并率先搭载于腾势Z9、Z9GT两款旗舰车型。“车生活 Agent”支持语音点餐,并基于人脸识别技术实现刷脸支付,完成订单后,系统将自动规划导航路线,形成“需求-服务-闭环”的无感体验。

在下一个层级的智能座舱中, Agent应用从“你说,我做”变成了“我看,我猜,我建议,我们一起做”。用户无需任何显性指令,仅是叹了口气,揉了揉太阳穴。系统便可通过大模型综合判断“摄像头”(疲劳微表情)、“生物传感器”(心率变化)、“导航数据”(连续驾驶2小时)、“时间”(下午3点(午后困倦期) )数据,了解到“用户处于长途驾驶疲劳期,有休息和提神的需求”。基于此,系统将主动发起交互:“您看起来需要休息一下。前方*公里有一个服务区,有您常喝的**咖啡,需要为您开启导航吗?同时可以为您播放提神的音乐。” 用户同意后,系统再调用导航、娱乐等Agent工具。

 

「联系方式」手机号同微信号

产业研究部丨符先生 15810027571

赵先生 18702148304

数据服务部丨张女士 13716037793

战略咨询部丨韩女士 15810133447

推广传播部|廖女士 13718845418

相关推荐

登录即可解锁
  • 海量技术文章
  • 点点互娱官网入口下载
  • 产业链客户资源
  • 写文章/发需求
立即登录
Baidu
map