最新资讯

对谈理想CTO谢炎:AI时代需要新的计算架构,我想在汽车上试出来

“现在马赫 M100 的业务目标达成度只有 60%。” 北京车展前夕,距离理想自研芯片量产装车只剩一个月,理想汽车 CTO、系统与计算群组负责人谢炎,“真正的成功,是搭载马赫 M100 的 L9 智驾能力跑到业界第一,然后车又卖得很好。那样我们才能非常有底气地说达到业务目标。”

1982 年,美国计算机科学家 Alan Kay 曾说,“你如果真正认真对待你的软件,就要自己做硬件。” 基于类似逻辑,理想在 2022 年立项自研芯片,并已为此累计投入数十亿元资金。谢炎是理想芯片自研项目的负责人。他 2022 年 7 月经美团创始人王兴介绍加入理想。半年后,他晋升为理想 CTO。

提起这个,谢炎在华为和阿里的前同事说他赶上了好时光——当时理想正值业务上行期,公司上下充满 “想赢” 的干劲。特斯拉证明了自研芯片对提升智驾体验的帮助,而国内新能源车市场正意气风发,资本市场也愿意给冒尖的新势力更多想象空间。

到马赫 M100 准备上车时,理想经历了自 ONE 交付以来的首次年度销量下滑,不仅纯电战略遭遇挫折,增程产品也面临空前竞争。随着新势力们挨个步入成立的第十个年头,中国新能源车的产品同质化和价格内卷相互促成。像自研芯片这等烧钱决策,如果当时看起来有多么理所当然,今天就要花多大的力气来证明它的正确。

通常情况下,没有经验的公司会从小芯片做起,低成本跑通设计、流片和供应链流程。即使是小芯片,失败一次也要损失数百万美元;换成先进制程大芯片,除了每个环节更难,流片成本也指数级增加到千万级美元,失败一次跟马斯克又炸掉一枚火箭差不多了。

谢炎刚加入时,理想芯片团队只有两名员工,不到一个月就剩一个了。留守的那位问他,“公司已经决定做芯片,但要怎么做?” 谢炎反对做小芯片试水。他告诉我们,理想不是为了证明有能力做芯片而做芯片,应该直接解决最核心的问题:确保首颗自研芯片量产时能超越同期最强的英伟达芯片。

他没有沿着更主流的 GPGPU 路线追赶英伟达,而是选择了数据流架构。按照理想的说法,马赫 M100 单颗有效算力达 1280 TOPS,同时由于数据流架构提供的算法优化空间,其有效算力是英伟达 Thor-U 的 3 倍。

数据流架构由 MIT 的几位教授在 1970 年代提出。谢炎在美国特拉华大学读研时接触到它,认为它比冯·诺依曼架构更接近大规模 AI 计算的需要,过去几十年一直没有大规模商用一是因为它的优势需要足够大的计算规模才能显现,二是编程和调试难度也更高。

谢炎相信 AI 改变了一些假设,“我相信 AI 时代会有一套新的计算架构,一直想在汽车上把它试出来”。他告诉我们,GPU 依赖集中式调度和大量数据搬运,规模越大,效率损耗越明显;数据流架构让数据驱动计算,理论上能减少等待和搬运,把更多晶体管用于真正的计算。但这也把压力转移到软件栈、编译器和软硬协同上。

杜克大学电子与计算机工程系教授陈怡然认为,马赫 M100 是一次有前景的工程尝试,但不应简单地认为数据流架构就是未来发展方向——关键在于采用哪种具体的数据流设计,以及它与目标应用和软件系统的协同效果。由于大部分优化工作转移到软件栈,实际效果很大程度上取决于编译器的成熟度,以及软硬件协同设计的质量。此外,自动驾驶算法模型演进很快,这种架构必须在 CNN、Transformer 等计算范式间保持足够的灵活性。

“数据流架构是一个宽泛概念,涵盖从脉动阵列、内核级数据重用方案到更激进的编译器调度架构(如 Groq)等多种设计。” 陈怡然教授解释,“马赫 M100 采用了介于传统 GPU/TPU 与 Groq 纯静态编译器调度模型之间的技术路线,通过编译器等软件更精确地控制芯片内部的数据流动和计算过程,既保持实用的 NPU/SoC 设计,又让数据搬运、本地缓存、互连通信和同步变得更可控。”

他认为,自动驾驶涉及环境感知、行为预测、路径规划等存在大量复杂计算任务的环节,现在还涉及大型 AI 模型推理。“如果软件系统能有效协调这些数据传输和计算,芯片利用率会显著提高,处理速度更稳定、能耗更低。”

谢炎承认马赫 M100 上车过程也确实有不少 “坑”:硬件设计复杂度降低,软件复杂度提高,对传统编程方式并不友好,第一版智驾模型从更新到完成车端适配用了两个月。尽管现在已经可以大幅缩短到不到一周,但仍有很大优化空间。接下来,他们还需要通过编译器等软件工具来充分释放芯片的硬件性能潜力。

这件事由一个不大的团队推进。理想芯片团队早期长时间只有几十人,现在约 200 人,仍远小于外界想象中的完整芯片团队规模。谢炎说,人多不一定好,人多时很多都是在搞政治斗争。核心部分自己做,后端、SoC 集成等环节可以借助供应商。在理想上万人的研发体系里,这个团队更像一个安静的角落,尽量不被每月销量起伏干扰。

“只要我们还没困难到一点儿钱都没有,那就保持这个研发强度,把内功练好。重要的是,你相信这件事本身不管在什么时代都重要。” 谢炎说。