2023汽车半导体生态峰会 || 毫末智行侯军:可行、可靠、可商用,助力智能驾驶行业繁荣与发展

发布日期:2023-09-27· 中国汽车报网 记者:张玉 整理 编辑:李沛洋
记者:张玉 整理 编辑:李沛洋

以“链启芯程 · 智造未来”为主题的“2023汽车半导体生态峰会暨全球汽车电子博览会”,由广东省工业和信息化厅、深圳市工业和信息化局、中国能源汽车传播集团指导,《中国汽车报》社主办,爱集微承办,于2023年9月26日至27日在深圳福田会议中心隆重召开。

本届峰会坚持行业领袖峰会的高端定位,全面助力产业间深度融合与创新,推动上下游产业链伙伴携手合作,共同构建具有全球竞争力的汽车科技创新新生态。

峰会现场,多领域、多视角开展的20场特色活动,囊括主峰会、技术研讨、项目路演、专业展览、交流盛宴等,汇聚政、产、学、研、用、投等多个产业圈层,围绕全球及中国汽车半导体产业热点展开交流,峰会重点聚焦新技术、新趋势,深入剖析汽车半导体各细分领域的发展机遇和挑战,近百个精彩纷呈的演讲,共同呈现出一幅专业而全面的思维图景。

其中,在9月26日举办的“ADAS与自动驾驶专场”,毫末智行科技有限公司COO侯军做了题为《可行、可靠、可商用,助力智能驾驶行业繁荣与发展》的精彩演讲。以下内容为现场演讲实录:

侯军:非常感谢大会的邀请,我从北京过来,今天给大家分享一下毫末智行在辅助驾驶和自动驾驶方面的一些思考和探索。

毫末智行科技有限公司COO 侯军

我今天的演讲标题是“可行、可靠、可商用,助力智能驾驶行业繁荣与发展”,我们最终聚焦如何规模落地,助力自动驾驶行业繁荣与发展。

大家从L1、L2、L3、L4这个技术说得非常多,但是技术最终要落地,如果把落地划分阶段,可以分为三个阶段。第一是可行阶段,就是让它具备一定的感知能力、算法控制和车辆控制,它可以在一定的区域进行测试和演示,但是它仅仅是可行阶段,离商用还远。第二是可靠阶段,就是车规级、全天候、全地形,不要说只有在晴天的深圳能跑,雨天的重庆不能跑,这个限制太大了,这个长尾的需求数不胜数。第三是可商用阶段,再先进的技术,最后落地的时候不能比以前更贵,只能比以前更便宜,这是规模成本,另外还要分场景需求,是乘用车还是商用车,是巴士还是物流小车。最后就是政策法规方面,政策法规很重要,今天的辅助驾驶还好,如果进入到自动驾驶,政策法规在哪些方向开放,包括对图和对数据的要求,都需要政策的支持。

毫末智行做了什么选择呢?我们在2019年11月创立的时候把自动驾驶做了一个简单的划分,横坐标是载人和载物,纵坐标是高速和低速,内圈是辅助驾驶,外圈是完全的自动驾驶,用这样一个坐标可以把当下中国所有与自动驾驶相关的公司放进去,大家是群雄逐鹿,各有不同的选择。毫末智行将人工智能在自动驾驶领域可以大规模落地的区域,作为我们的率先选择。所以我们选择两个象限,第一是高速载人的辅助驾驶,就是目前的ADAS,这个领域现在的数据已经不言而喻了,但是在三四年前大家谈渐进式和跨越式的时候,还有很多的争论。刚才主持人和一汽的领导都说了,去年的数据是30%,今年已经到了40%。第二个选择是低速载物的完全自动驾驶,就是末端的无人物流,这个领域由于它的速度比较低,重量比较轻,在局部区域是可以规模落地L4的,过去三年在中国已经有很多的创新实践。但这不代表其它区域不行,比如高速载物的卡车、低物载人的汽车这方面还需要探索。我们总结,过去三年自动驾驶的发展是从低速到高速、从载物到载人、从商用到民用。目前行业内都是采用渐进式的路线,这条路更容易攀登一些,犹如珠峰的南坡。

这是我们年初做的预测,现在来看基本已经尘埃落定了。第一个是关于辅助驾驶的搭载率的激增,去年是30%,今年已经到了40%,到2025年我们的预测和行业的预测都是会到70%,甚至是说高级别辅助驾驶到70%。2025年距离今天也就两年左右,过了15%到20%的死亡之谷的拐点之后,未来的推广会非常快的。今天买新车如果没有智能驾驶、智能座舱,估计很多人不会买了,至少今天在座的人不会买这些车。第二是关于行泊一体的前装市场持续向上,各家都是英雄所见略同,包括算力的节约、成本的节约等等。第三是末端物流自动配送商业化闭环拐点到来,这部分大家可能了解的不是太多,我后面会给大家详细介绍。

毫末智行成立于2019年,我们的核心战略是“风车战略”,最核心的点是数据智能,有“三大扇叶”:乘用车的辅助驾驶渐进到自动驾驶,低速的无人物流车和智能硬件。我们坚信利用成本和规模的优势,使用数据智能逐步落地自动驾驶的产品。

这是我们前天的数据看板,目前乘用车用户辅助驾驶行驶里程已经超过8000万公里,低速无人物流车在开放道路的订单已经超过21万单,因为低速无人物流车在开放道路只有局部区域可以,比如北京的顺义马坡、北京亦庄,或者是深圳坪山这些区域可以跑,它是完全的L4,在这两个领域,我们形成了数据的闭环和数据的积累,目前应该说学习时长已经超过90万小时,相当于人类的虚拟驾龄12万年。这个数据看似很大,但是还远远不够,因为有人推测,真正要实现自动驾驶可能需要百亿到千亿公里的数据量,从0到90%靠专家模型可以做,从90%到99%在1亿公里以内可以,但是从99%到接近100%,实现真正的安全,需要更多的积累。

我们把过去10年-15年自动驾驶的发展简单分为三个阶段,第一阶段是在2015、2016年之前,美国和中国的少量公司以非常昂贵的硬件堆砌起来,在少量的特殊路径可以做演示和测试。2015、2016年之后,大量的公司开始进入到软件驱动,传感器可以单独输出,利用专家模型,少量的小模型、小数据,应该说今天这个阶段持续到现在,大部分公司都在这里。这个阶段够不够呢?可能高速公路是够的,因为中国有30万公里高速公路、1000万公里的城市道路,客观来讲高速公路用这个规则是可以跑的,因为高速公路的场景整体是简单的,除非一些特殊的情况,比如在高速公路上晒麦子,在偏远区域是发生过这种情况的,这实在是处理不了的,在整体情况下,高速公路靠2.0的软件驱动是可以的。如果继续往前走,前面专家也说了,包括今年的趋势,大家就是“进城”,包括蔚小理、华为、毫末智行都立了Flag,怎么进城呢?如果仅仅依靠小数据、小模型,你会遇到无数的问题,在城市中最难的是人车、人人以及各种环境的道路的博弈。这种情况下就需要大模型、大数据和大算力的推演形成它的能力和规模,而不仅仅是用确定性的规则。

基于上面这些理解,给大家一个简单的罗列,毫末智行从2021年5月份上车我们的1.0版本,到2022年4月份的2.0版本,基本上实现了高速公路的行驶和高速公路+城快、泊车的行泊一体大规模商用,这确保了我们的数据积累,目前也是跟几个头部的公司共同进城,我们叫3.0版本,我们会率先在北京、保定和上海进城,我们也是立了一个Flag,希望在明年进100城。

在高速公路上我们的NOH开启率已经非常高,现在大家越开越灵活,基本上点到点的行驶可以做到脱手脱脚,当然有法规,30秒或者2分钟有提示,要触摸一下方向盘,但是在能力上,可以自动驾驶一两百公里,这是很常见的事情。
   还有一个重点就是在城市落地,毫末智行的核心能力就是重感知,通过摄像头和激光雷达的重感知能力。另外一个是大模型,毫末智行在今年4月份发布了DriveGPT,目前训练模型的参数超过1200亿,还有司机的底层学习的实时反馈,以及我们的大算力,毫末智行建立了中国自动驾驶领域最大的智算中心之一,从去年承建到今年,包括小鹏、理想等都建立了自己的智算中心,大家在这个领域的投入都非常大。
   第二部分,分享一下关于低速无人物流车,因为今天的主题是从ADAS到自动驾驶,我认为乘用车的自动驾驶还需要很长的时间,要实现规模商用才算大规模落地,如果讲可行的话,今天在深圳、上海、北京大家都能遇到测试可行的Robotaxi,但是低速无人物流车的时间已经来了。先给大家一个信心,我们每个人都是快递、外卖的受益者,快递和外卖从业者是1200万-1500万人,根据国家邮政总局和行业的预测,未来我们的快递和外卖的量还会翻一番,但是从业者很难再翻番了,现在我们的人口出生率已经很低了,而大家对美好生活的追求不会降低,所以我们现在在做一个尝试,让低速无人物流车和快递、外卖小哥进行人机协同,现在标准的外卖和快递的程序是从中心仓由小哥取了之后直接送到用户面前。我们换一种人机协同方式,让无人物流车从中心仓快速配送到小区门口,快递小哥在小区门口拿着这个外卖或者快递之后,他覆盖到相关的楼栋, 以前一个快递小哥比如能覆盖10栋楼,现在通过人机协同可以让他覆盖20到30栋楼,这样就可以有效地提升效率,同时也降低小哥的劳动力成本,提高他的收入。
   我们从最早的技术研发调试、实地测试、规模化运营和商业化应用,今天来看商业化应用的节点已经到了,这个节点就是可行、可靠、可商用的技术能力、政策法规和成本已经到了临界点,这个成本的临界点就是10万元以内,这是有L4整车能力的,包括车底盘、车体、感知预控甚至网络运行的能力。
   毫末智行做了什么事情呢?毫末智行在过去3年半里面,把低速无人物流车的成本从2020年行业的百万级水平,毫末智行当时的成本可以做到50万;2021到2022年毫末智行的第二版车的价格降到12.9万,行业的水平在25万左右;今年6月份我们官宣把成本拉低到8.9万,行业目前的水平在15万左右。我们希望用这样一个综合成本的降低,助力行业的发展。当然这个综合成本降低并不是要亏钱做,因为我们也亏不起,实际上核心能力就是产业协同,因为毫末智行在乘用车的辅助驾驶,无论是感知部分还是预控部分都是以万台、十万台在采购和出货,我们今天低速无人物流车能够与乘用车协同的全部协同,比如说激光雷达、摄像头、域控制器部件,协同之后可以让我的成本大幅下降,甚至是行业水平的1/3到1/4,当然车体和底盘还是需要点钱的,我们今年基本上可以做到8.9万的单价,我们长期的目标是3年内把成本降到5万块钱,这就意味着当我们订单量再翻一倍的时候,由目前4亿单每天的快递量翻到8、9亿单每天的量,很多任务由低速无人物流车承担工作,可以很好地实现人机协同。深圳南山最近也在开全域开放,坪山已经开了,这些区域我们毫末智行都会进行落地试商用和试运行。
   这是我们过去三年的几个阶段,包括有毫末智行自己的三代车,也包括跟美团、阿里、北京的连锁超市物美、达达的助力和合作,很多方面做了很多的探索,这是完全的自动驾驶,它的关键是可行、可靠、可商用的,技术、规模成本和落地法规,这三项缺一不可。
   说了这么多,辅助驾驶和自动驾驶最核心的是什么?不是这些L2、L3的数字,而是底层如何实现这些数字,应该说人工智能最核心的落地无非就是三要素:大模型、大数据和大算力。关键是如何把这三要素结合起来,与所应用的场景结合好。第一项就是大模型,毫末智行在过去三年里面也做了很多的探索,毫末智行有一个AI Day,今年第九期AI Day将会在10月11日举办,我们希望把我们对科技的认知贡献出来,与行业携手同行。有一个私心也是公心,我们希望这个行业一起发展,我们去年和前年推大模型的时候推得很累,大家不知道你要做什么。现在来看,大家越来越觉得大模型、大数据、大算力,特别是ChatGPT出来之后,大家都认为是真的。比如在今年4月份我们的AI Day发布了我们的大模型DriveGPT。ChatGPT是聊天机器人和对话的模型,包括它的预测对模型的预训练和生成,而DriveGPT是针对自动驾驶机器人自动驾驶模型的输出,它输入的是视觉传感器的序列,输出的是未来2-3秒BEV的序列,也包括自动驾驶汽车和所有障碍物。可能说得有点拗口,再给大家看下一张图,这就是我们在DriveGPT的基础模型,通过海量数据的训练,比如今天已经有8000万公里实车的数据,也包括一些测试数据,通过训练之后,结合专家模型不断地迭代,也结合超算中心的算力助力,当我遇到一个场景的时候,根据我的模型能力和感知能力,有点像人类开车,我们过一个十字路口的时候有多种方式,比如快速超车、等待,甚至直行之后绕行等,今天DriveGPT也会逐步具备这种推理决策的能力,这是我们希望预训练的能力在自动驾驶落地,这样真正解决我们长尾的需求,否则真正靠专家模型和提前训练的场景,我们是无法进行全部覆盖和迭代的。
   这是DriveGPT最核心的两块模型,一个是感知能力,一个是认知能力。感知能力里面有四大块:一是视觉自监督,二是多模态互监督,三是3D重建大模型,四是动态环境感知大模型。在认知方面,包括我们今天海量的驾驶,我们装了解决方案的司机和驾驶员会给我们反馈,这就是一个人驾自监督的认知大模型,比如过十字路口或者环岛行驶,为什么大多数人都是这么走的,而你不是这样走的,因为你是属于少数派。
   大模型之后是大数据,除了里程之外,这个行业有一个关键指标就是标注。人工智能有一个大家调侃的话“有多少人工就有多少智能”,标注方面我带了两个例子,目前一张2D帧的平均标注成本是4到5元,通过我们视觉自监督的训练之后,可以把成本拉低90%,或许还可以更多。但是我们可以说对所有场景官宣先降到0.5元,先降10倍。另外2D帧也是远远不够的,今天真正进城的公司肯定不是用2D帧,实际是用BEV的连续帧,BEV的连续帧是什么?给大家看一下。
   我们从数据的采集、存储、标注到计算等等流程,中间有一个节点是比较显性的成本,就是标注成本,如果是2D帧,自动驾驶公司需要数亿甚至数十亿帧标注的数据量,如果按几块钱一帧的成本,这是一个天文数据。据说特斯拉有1000人的标注团队,同时还有大量的自动化标注能力。2D标注数据也远远不够,大家需要Clips,可以认为是一个视频,它加了激光雷达信息,不仅仅是一个短视频,这种情况下它的数据量更大,比如10秒钟的clips数据量是一张2D帧的上万倍,如果按照2D帧的标注价格来算,这个价格是没有人能承受起的,另外也需要很多Clips才能真正实现城市级的点到点的高级别自动驾驶。今天在城市里从辅助驾驶到自动驾驶,还是需要大量的数据支撑的,这里面除了传统的人工标注之外,我们希望用自动化标注的能力,为自己和为行业做一些助力。
   说完大模型、大数据之后,最后再说一点大算力。我们在去年年底、今年年初建立了中国自动驾驶领域最大的超算中心之一,目前的浮点运算能力是67亿亿次/秒。
   这是我们目前落地的车型,特别是基于我们3.0的综合能力,已经在魏牌蓝山、摩卡、小魔驼3.0上快速落地。
   今天是行业大会,再次阐述一下我们的合作原则,我们的合作原则是:深度开放的合作模式,真正以客户为中心。什么叫以客户为中心?客户要什么我们就给什么,从下面的解决方案到云端服务、硬件、模块、软件、源代码、数据、标注工具等,我们一切可以打开。对于我们的客户和合作伙伴,只要大家有机会在一起,我们最大的挑战不是你我他的竞争,而是明天来了我们谁还在,这时候我希望你的灵魂你保留,我的灵魂你带走,我们不怕你带我们走,我们完全可以打开,甚至不需要数据回传等。今天不是大鱼吃小鱼,真的有可能是快鱼吃慢鱼,我们、你们和他们只要能有机会一起合作,保持奔跑速度,能先跑到明天,这个江河湖海足够大,而不在于今天大家一定要自己做所有的事情,因为不见得所有公司都能做所有事情,除了极少量的公司。因为这个事情太难了,特别是这个行业是需要大家相互合作和支持,或者相互助力的。

这是我们在过去4年的客户、供应商、合作伙伴、投资人,他们对我们有很多的支持和助力,确保我们砥砺前行。
   最后用我们的Slogan作为今天的汇报和介绍的结束:让机器智能移动,给生活更多美好。

热门推荐