不仅是车企的战争,与 Momenta 创始人曹旭东聊智驾供应商生存法

Episode 77 · August 12th, 2024 · 1 hr 21 mins

About this Episode

本期节目,我们访谈了智能驾驶供应商 Momenta 的创始人曹旭东。

Momenta 是曹旭东第一次创业,他 8 年前成立这家公司时刚满 30 岁。这之前,曹旭东在清华学物理,后来获得直博机会,但他中途从清华退学,转而去微软亚研院做 AI 视觉研究;2014 年,他加入了刚成立的商汤,创业前,他是商汤的研发总监。

在 2020 年之前, Momenta 都谈不上耀眼,它好像从来没成为过智驾行业里的 AI 四小龙或大模型五虎般的存在。而在 2021 年,这家公司却在一年里融了 10 亿美元,它的大部分融资都发生在这一年。

背后的逻辑也简单:特斯拉在 2020 年大卖,仿佛一夕之间,量产高阶方案就被接受了,而 Momenta 一直在做这件事,过去没什么反响,如今有了客户,而且是最多客户——目前 Momenta 手里有最多的智能驾驶车型定点——包括上汽智己,这是 Momenta 的第一个大客户,还有后来的比亚迪、广汽等等,数量超过了华为。

所以现在智驾行业里有一个新组合,叫“地大华魔”,指地平线、大疆、华为 和 Momenta,它们被认为是智能驾驶供应商里的头部玩家。

现在这一批 AIGC 公司的故事有些像自动驾驶的昨天:极高的期待,大额的融资,优秀的人才,在短时间里汇聚到一起。而一批智驾公司的今天,则展现了一个黑科技领域发展 10 年后可能会是什么样子。

我们和曹旭东讨论了 2023 年以来智驾领域的诸多变化,以及 Momenta 的策略与选择。这个行业还有很多悬念:车企与智驾供应商应该如何分工?在端到端大模型的大方向下,怎么选择具体的技术路线?未来市场格局会有多集中?能容纳多少公司?活下来的公司会是什么形态?

这次访谈的文字版,之前已经发布在《晚点》的公众号上,可见 shownotes 里的链接。

时间线传送:

·FSD 半年进化了几十倍,智驾在买车决策里更重要了

03:10 一年半前最担忧的事是 L2+ 不能真的帮车企卖车
04:12 技术进步,华为问界的催化改变了局面
07:07 部分车企等不及自研,更积极用供应商
08:41 FSD 进中国为是好事,卷价值,而非卷价格
10:07 欧美客户试乘后的评价
12:01 智驾公司盈利的条件
12:46 如何衡量智驾供应商的位置?体验、客户质量、客户数量
13:57 三维度对比,华为 vs Momenta

·超越智驾摩尔定律,未来第一名会占 70% 市场份额

16:31 智驾摩尔定律:每两年硬件 BOM 成本降一半,软件性能提升 10 倍
17:42 产业链定位,为什么 Momenta 做 Tier 1(直接给车企供货的一级供应商),而非 Tier 2?
18:56 整车追求差异化,智驾则没有差异化,只有好与更好
20:10 垂直整合,原因与边界
21:54 价位下探,未来 15 万的车也会标配高阶智能驾驶
22:34 和高通合作则不仅为性价比,也为上油车、混动
23:41 同时和英伟达、高通合作,什么体验?
25:26 低水平竞争可能会在两年内结束
27:17 智驾出海的机会和挑战

·端到端不难,难的是做高端到端的下限

29:02 端到端大方向下可能有 10000 条路
30:17 Momenta 开发端到端:用神经网络做感知→用神经网络做决策(deep learning planning)→感知、决策合成一个大模型
32:07 2021 年底的重要选择,当年底交付的方案到底用模型方法还是用规则方法?
35:39 新方案如何让客户信任
38:36 做出端到端不难,提高下限难,这是个体系工作
40:49 如何提高持续做对技术判断的概率?——低成本短周期试错
44:23 “正确的大方向”举例:围绕交付建立高效体系
46:11 短期压力导致短期救火,导致团队崩溃,坚持主线产品不分叉很重要

·“做有杠杆的事”

51:11 多发钱、高人效
51:45 Momenta 如何从 400 人交一个车型到现在几个人交一个车型
53:40 公司现在最大的杠杆,产品能和技术
54:37 组织目前的杠杆:持续招到和晋升更好的人
58:16 把公司战略穿到身上
01:00 重要决策来自小会议,人数一个车上能坐下
01:02 成为最终头部的挑战,全球化


01:03 在六道口试乘无图端到端,车上聊天

相关链接:
对话 Momenta 曹旭东:超越智驾的摩尔定律
https://mp.weixin.qq.com/s/QAZvo8xNw8UyIotyer7rEw

本期人物:
曹旭东,没有驾照的智驾公司创始人
程曼祺,晚点科技报道负责人,即刻/小红书:曼祺_火柴Q

剪辑:甜食

附录:自动驾驶图示 & 播客中提到的一些术语

自动驾驶有感知(Perception)、规划与决策(Planning)和控制(Control)三个模块,靠感知 “看”,靠决策 “思考” 怎么开车,靠控制模块完成驾驶行为。
端到端技术现在一般指从感知到决策,整个过程用一个大模型实现。
而过去的智驾技术系统,尤其是决策模块会使用大量编程写就的规则,而不是用深度学习来做。

我们在播客中聊到,Momenta 做端到端的过程,是先用深度神经网络做了感知,这是 2021 年之前很多公司就能做到的事,接着是在 2022 年用深度学习做了决策,也就是反复提及的“deep learning planning”,之后在 2023 年把两个分段的模型合成了一个端到端模型。

扫描二维码,可关注《晚点 LatePost》: