长城汽车CTO吴会肖与影视飓风创始人潘天鸿(Tim)进行VLA Talk
“丝滑”“很丝滑”“非常丝滑”…这是影视飓风创始人潘天鸿(Tim)在体验过全新智能进阶版辅助驾驶后给出的评价。
继广州车展长城汽车宣布基于VLA辅助驾驶大模型方案的全新一代辅助驾驶系统Coffee Pilot Master(简称CP Master)首搭魏牌之后,12月1日,长城汽车VLA Talk正式开播。针对这套全新的辅助驾驶系统,长城汽车CTO吴会肖与Tim展开对话,共同向外界展现了一场有案例、有场景、有逻辑的深度解析与体验。
对于搭载VLA大模型的全新蓝山智能进阶版辅助驾驶系统的体验感受,Tim直言,这简直就像是老司机在操作。吴会肖更是指出长城VLA大模型除了给用户带来丝滑的体验外,最重要的是要为用户提供更真实、更安全的辅助驾驶,而这也正是长城汽车所推出的VLA大模型最显著的标签特性,以及所承担的技术使命。
长城VLA大模型如何破局“黑盒焦虑”?
今年前7月,中国具备L2级辅助驾驶能力的乘用车渗透率达到62.6%,较2021年增长40个百分点。但另一方面,一份调研数据显示,仅有不足5%的用户高频使用辅助驾驶功能,其中“黑盒困境”成为制约用户主动使用该功能的首因。基于此,长城VLA大模型应运而生。所谓的VLA大模型,是指视觉-语言-动作(Vision-Language-Action)的缩写,是一种融合视觉、语言和动作控制的多模态人工智能技术框架。吴会肖用“听得懂指令、看见看不见的危险、会思考推理”来概括VLA大模型的场景功能。吴会肖明确指出,希望这套VLA大模型是第一,但第一不是和大家的排名,而是安全第一,体验第一。

长城汽车VLA辅助驾驶大模型
在吴会肖看来,家庭用户是高端新能源市场的核心群体,他们对辅助驾驶系统的安全、稳定、可靠要求远高于其他群体,而传统辅助驾驶系统的机械特性根本无法满足这种需求。长城汽车研发VLA大模型的初衷,就是让AI学会像老司机一样思考,甚至学会“害怕”,从而提前预判风险,而不是等到风险发生再被动应对,长城VLA大模型就是要做辅助驾驶场景的思考者。这也就是Tim所说的“全新蓝山智能进阶版VLA大模型的防御性驾驶,是中国人讲究的未雨绸缪。”

长城VLA大模型能看见“看不见”的危险
在实际场景体验中,搭载CP Master辅助驾驶系统的全新蓝山智能进阶版完美展现出了“听得懂、看得见、会思考”的特性。对于“听得懂”,主驾可以语音激活语音助手,支持“帮我起步”“靠边停车”等语音指令控车,比如当你说出“小魏同学,靠边停车”,车辆便可按照语音指令,在环境满足的情况下,实现对车辆行驶行为的精准控制。这背后是通过多模态与大语言模型的深度融合,构建更自然、直接的人车交互,用户可通过语音控车功能完成车辆控制。“看得见”则是指车辆具备“防御性驾驶”,全新蓝山智能进阶版能感知可见物体,更能理解“遮挡=潜在危险”,比如当检测到路边有球时,车辆会预判可能会有儿童突然冲出,提醒驾驶者要提前做好制动准备。这是VLA大模型依托空间语义理解能力,能够通过当前的道路情况,推理未来可能会发生的情况,将安全防线从“被动应对”前移至“主动避险”。