系列评论之三:在智驾领域 国内与特斯拉差距有多大?
“特斯拉FSD进入中国”系列评论之三:
在智驾领域 国内与特斯拉差距有多大?
雷歌 2024年5月7日
许多不太了解行情的人都有疑问,目前在无人驾驶领域领跑是特斯拉吗?特斯拉的FSD不是“辅助驾驶系统”,最多也就是L2+级别吗?而谷歌Waymo和通用Cruise的无人出租车不是去年就已在旧金山正式营运,达到了L4级别,实现了真正安全的无人驾驶,难道不比特斯拉先进吗?国内百度的无人出租车已经出到第六代,“萝卜快跑”在武汉正式投入商业营运的时间甚至比Waymo在旧金山营运还早一年,都是L4级别的无人驾驶。这些公司难道不比特斯拉的FSD强?还有人觉得,这次特斯拉与百度签约,这两家是不是要在智驾领域有深度合作?
其实特斯拉与百度最新合作的核心,是百度授权特斯拉使用其在中国公共道路上收集数据的地图牌照。在中国,所有智能驾驶系统都必须获得测绘资质才能在路上运行。外国公司需要与获得许可证的国内公司合作。而百度就是获得测绘资质的十几家公司之一。
特斯拉与百度的这次合作也包括使用百度的最新版车载导航地图V20版,新版导航地图号称能“让3亿汽车扔掉手机支架”。两家在导航地图方面的合作早在2020年就已开始。
所以特斯拉与百度的合作,实际上与智能驾驶并无实质性关系。
此前的文章我已经深入讨论过Waymo和百度等选择的“模块整合”路线与特斯拉FSD的“端到端”模式的根本性差别,通俗一点讲,就在于前者成本昂贵,无法最终实现商业化落地,变成了一个吹水和展览的花瓶。
如果从专业一点的角度对这两种路线进行解读,“模块整合”路线就是把感知、判断、决策以及规则都当成独立模块,依靠程序员提前写好的代码来设定模块间的互动协议,最佳决策输出是依靠芯片傻算,也就是通过“穷举法”找到最佳答案。所有的输出决策都是程序员提前规定好的。一旦遇到未设定的全新场景,这种模式就会失效,错误百出。所以,Waymo或百度的无人出租车要驶入一个新区域,该区域的高精地图要提前做好,还要不断靠人工标注来应对道路上随时出现的新变化,成本非常高,而路况的变化又难以穷尽。
而使用神经网络深度学习的“端到端”AI训练大模型,却摆脱了程序员的控制,通过大数据的深度训练获得了自主决策的类人化智能。所谓“端到端”,就是“视觉输入,决策输出”,这就是人的驾驶方式。只要数据训练量足够,系统就能在千变万化的真实场景中作出准确判断和正确反应。这才是真正的人工智能!
目前美国这边的Waymo、Cruise等无人出租车公司的估值与几年前的高峰期相比已缩水50%-70%以上,因为整天烧钱(如Waymo已经烧钱150亿美元),有的已经倒闭,还在硬撑的也收缩战线,大幅裁员。已经基本看不到成功商业化的希望。
那国内的情况如何呢?
一些人整天看国内的新闻,觉得国内的无人驾驶技术在全世界已经“遥遥领先”,就像许多国人觉得华为mate60搭载的5G芯片“遥遥领先”一样(实际上只有台积电三五年前的水平)。国内智驾行业现在虽然热闹非凡,现实却是落后美国至少三年。
国内无人驾驶技术从十年前到现在都只是美国公司的跟随者,国内智驾领域的创业者和核心技术骨干,基本都是在美国求学并在美国相关公司从业之后回国的。以百度为首的众多无人驾驶出租车公司早年都采用了与谷歌Waymo一样的激光雷达+高精地图的模块整合路线,现在也都陷入了与Waymo同样的无法商业化落地的困境。
百度是国内研发无人驾驶出租车的老大,也是国内智驾领域培养技术骨干的“黄埔军校”,国内各大公司智驾研发的核心骨干,一大半都是从百度出来的。
与谷歌的Waymo一样,百度的“萝卜快跑”无人驾驶出租车在武汉的商业化营运,同样只是在有限区域内展开,因为每一次区域的扩展,都需要高昂的成本。仅无人驾驶所需的高精地图(注意不是一般导航用的高清地图)制作,最基本的费用就要3000元/公里,还需要大量人员不断进行人工标注以因应路况的随时变化,一个程序员每天只能完成十多个标注。而百度在武汉只有100多辆无人驾驶出租车在跑。如此高成本的投入获得的数据却非常可怜。十多年来,百度在无人驾驶研发上烧的钱高达1700亿人民币,折合成美元近240亿美元,远超Waymo公司150亿美元的投入。这种烧钱模式使众多无人驾驶出租车公司难以为继。
自2023年特斯拉FSD的V12版发布以来,所有无人驾驶出租车公司都意识到,FSD“端到端”的AI深度学习大模型才是无人出租车的未来。
以Waymo为首的美国无人出租车研发公司因为引领了过去的“模块整合”潮流,并在其中陷得太深,还有点行业老大放不下的自尊,至今反应缓慢,面对全新的前景有点不知所措。
而中国的众多公司从来就是紧跟美国的最新科技潮流,他们倒没什么包袱,反应很快。从2023年开始,几乎所有中国的无人驾驶出租车研发公司都开始转向特斯拉FSD的“端到端”模式。但目前转型还处于起步阶段,而且受到数据和算力的双重限制。
自特斯拉FSDV12版本发布以来,百度就被国内业界嘲讽为“起了个大早,赶了个晚集”。今年三月,百度集团副总裁、百度智能驾驶总裁王云鹏回应外界对百度走向何方的怀疑时表示:“智能驾驶这么难的事情,我们已经坚持了十年……坚信、坚定和坚持已经深入骨髓,已经成为我们工作的习惯,我们在最艰难的时候都一直没有放弃,现在曙光已现,更加没有理由放弃。”听出话风了吗,他们都在讨论要不要“放弃”的问题,说明他们正处于行业发展的十字路口。
当然百度不会放弃。上个月,王云鹏在谈到百度智能驾驶的未来发展时,强调百度智能驾驶要打好四场硬仗,其中第一场硬仗,就是要用大模型“重构”自动驾驶技术路线,从重构自动驾驶的基础模型开始,“重构技术与产品”。
了解了无人驾驶“模块整合”与“端到端”这两种不同路线的竞争背景,我们就不难理解百度现在说的“重构自动驾驶技术路线”的意思,实际上就是像特斯拉FSD在2021年所做的一样,从“模块整合”路线转向“端到端”路线。
这种艰难的转型从2023年已经开始。据百度自己介绍,去年百度智驾团队在3个月内用500万新增数据 “成功拿掉了激光雷达,打造了国内唯一、世界唯二的纯视觉高阶智驾可量产方案”。这个“世界唯二”的“纯视觉”智驾方案,就是指跟随特斯拉FSD,开始走模拟人类驾驶的“端到端”路线。
但国内无人驾驶出租车研发公司因为转型刚刚起步,无法立刻摆脱旧模式的激光雷达和高精地图。因此,大多数研发公司的现状,目前是“两条腿走路”,既从基础技术架构上构建“端到端”大模型,又在试验车上保留原有的激光雷达和高精地图。保留的另一个原因,也是因为这类硬件的成本在最近五年内已经大幅下降,整套雷达传感器系统现在可以做到2万人民币左右,而早年Waymo使用的激光雷达每个高达7万多美元,每辆车要用好多个。百度的第六代无人出租车RT6带38个雷达和传感器,整车价格已经降到25万人民币。但这些雷达对特斯拉FSD系统而言都是多余,是不必要的成本。特斯拉FSD只用稀松平常的车载摄像头,像素跟我们常用的手机一个水平,就完全够用。关键靠的是模拟人类驾驶的算法。
目前国内做“端到端”智驾平台最好的一家科技创新公司叫“元戎启行”。但其创始人周光承认,目前“元戎启行”智驾平台的水平只相当于特斯拉FSD的V11版本,他们还有很长的路要走。特斯拉FSD的V11版本与目前最新的V12版本有质的差别。
国内自动驾驶行业虽然风起云涌,群雄争霸,大家纷纷转向“端到端”模式。但“端到端”模式依赖于AI神经网络深度学习系统,除了算法,还需要有海量数据不断投喂训练,同时用超级计算机的超强算力快速消化这些数据,才能通过自我学习实现系统的快速升级。
而这正是特斯拉的优势,也是中国同行的劣势。特斯拉每天有近6百万辆各类电动车在全世界的各种路上跑,每天产生海量的有价值数据。同时英伟达等芯片公司也在不断提升芯片的算力,使特斯拉的Dojo超级计算机处理数据的能力每年都以十倍以上的速度提升。反观中国,众多研发自动驾驶的公司自己没有量产的电动车提供数据,同时因为欧美对中国的高科技出口限制,能使用的芯片算力与最先进的差了三代以上。而且国内公司在“端到端”模式上起步就比特斯拉晚了三年以上,在这种条件下要想赶超特斯拉,真是个“不可能完成的任务”。
这种落后局面,可能也是中共决定放特斯拉FSD进来,争取借船出海,乃至浑水摸鱼的主要原因。
欢迎关注“雷歌视角”,帮你挖掘新闻背后的新闻。
雷歌视角油管频道最新上线:
https://www.youtube.com/channel/UClfm_D5GrSVn59znfs8JD1g
请订阅、转发和点赞。谢谢!