元戎启行周光:智驾行业尚未100%进入大模型时代
“智驾行业尚未100%进入大模型时代,本土数据闭环是对抗特斯拉FSD技术差距的关键。”近日,在以“夯实电动化 推进智能化 实现高质量发展”为主题的中国电动汽车百人会论坛(2025)期间,深圳元戎启行科技有限公司(以下简称“元戎启行”)首席执行官周光在接受媒体群访时表示,高阶智驾涉及复杂的数据闭环与人才积累,短期难以被车企完全自研替代。
周光认为,元戎启行的核心优势在于提供头部的技术与智能驾驶体验。他提出,元戎启行定位为“物理AI公司”,致力于推动AI从弱专家系统向通才系统演进,并打造强专家系统,智能驾驶只是AI在物理世界落地应用的首个场景。
“与特斯拉FSD有差距”
在技术层面,周光认为,当前智驾行业多数方案仍依赖弱专家系统,而元戎启行正探索端到端架构与VLA(视觉-语言-动作模型)技术,目标是构建移动场景的“通才系统”。
他续言,VLA模型是实现L5自动驾驶的必经之路。目前的端到端模型能处理道路上大部分的驾驶路况,但不能理解特殊车道的行驶规则;VLA则能补齐端到端模型的短板,是一位“驾驶通才”,看得懂语义信息,能理解特殊车道的驾驶规则。周光认为,只有先成为“驾驶通才”,才能成为驾驶领域的专家,即实现L5级完全自动驾驶。
针对L3级自动驾驶,他认为,AI能力越强,工程兜底需求越低。元戎启行已为市场需求推出 拼接式车位到车位功能,但其技术价值有限。
关于算力争议,他预测,未来车端算力需求将持续攀升,L5级自动驾驶必然依赖高算力与大模型协同。
就特斯拉FSD入华,周光坦言其V13版本“技术领先”,但他认为,中国企业的本土化数据闭环能力是关键优势,特斯拉无法在华采集数据,优化效率受限。
对于行业热议的“智驾平权”,周光透露,元戎启行今年将推出适配不同芯片平台的解决方案以降低成本,但不会为极致降本牺牲技术上限,并计划通过通用AI架构提升商业化效率。
“元戎启行一直在追求AI的天花板。”周光说,如端到端、无图,大家看到我们在国内第一个做的,我们提无图方案的时候更是对行业有一个冲击,我们2023年推无图,大家全都在说我们是假的。但是我觉得现在是一个时候了,我们既要追求AI的上限,同时也要追求规模化的商业化,今年也会推出一些解决方案,支持不同的芯片平台,可以把成本进一步降低。
在他看来,元戎启行并非极致追求降本,而要在保证体验良好的情况下去降本。特别便宜可能会损失持续发展的能力,追求AI上限,打造物理世界AGI(通用人工智能)的意义更重要。
“VLA是个上限问题”
“VLA是指一个上限问题,L3是指一个下限问题,这是两个截然不同的方向。”周光表示。
元戎启行的VLA模型,更多是在实现强大的专家系统之前,让现有的系统能通用。
周光表示,5-6年前大家谈RoboTaxi和L5,就预测说5年后一定能达到,其实这个时间点一直在向后拖延,中间来到了L2+和L3。他说,大模型只有经历了一个弱专家系统到通才系统,到真正强专家系统的阶段,这是一个AI发展的过程。
他强调,现在提的AI通才系统是有限定领域的通才,更大的通才是最终的通用人工智能,包含了语言、物理世界等能力,目前的技术无法支持,但是现在新一波技术突破是可以支持这种限制场景下的强专家系统,这已经被证明了。“只有达到全知全能,重新定义,才是一个条件生成模型的AI。”周光认为。
“自动驾驶都是跟着语言大模型在走。”周光表示,语言大模型系统有三个趋势,首先,语言系统在GPT推出之前是一个弱专家系统,可能是小学生或者幼儿园水平。GPT推出之后,成为一个通才系统,GPT可以刷考试题,可以认为其达到了211、985“高校”水平,今天逐渐达到博士的水平,这是人工智能的提升。接下来,语言大模型的发展方向是强专家系统。随着弱专家系统发展通才系统、再发展到强专家系统,才会助推智能驾驶发生新的转变。
编辑:薛亚培