原文摘要

今天又是一集机器人专场。嘉宾是光轮智能创始人兼CEO谢晨,他曾在英伟达、Cruise及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体,即:仿真与合成数据。
今天的具身智能尚且没有找到scaling law的有效配方,其中,数据是一个关键卡点。我们106集的嘉宾银河通用创始人王鹤就提到,真实数据在他们的训练数据比重仅仅1%,合成数据挑起大梁。
今天这集节目,我与谢晨聊了聊仿真与合成数据的实操细节。



02:00 开始的快问快答
02:48 高频词汇解析:Sim2Real(从仿真到现实)、Sim2Real的gap、合成数据
04:31 从Cruise到英伟达到蔚来,怎么做合成数据和仿真?
14:11 制作合成数据的具体流程?合成数据与真实数据的配比?
16:17 在合成数据上,智能驾驶和具身智能的区别(智能驾驶是视觉的游戏,具身智能的物理交互最关键)
32:41 物理的Real2Sim(真实到仿真)工作流是怎样的?怎么评估成功的仿真?关键技术节点?
46:18 Physical Intelligence(π)对仿真与合成数据的两难态度
48:55 辣评Meta 300亿美金收购Scale AI和极其aggressive的Alexandr Wang
53:57 合成数据目前面临的瓶颈
55:25 全球具身智能产业链Mapping:
硬件公司(宇树)
基座模型公司(π、Skild、英伟达和DeepMind)
在垂域落地的软硬结合公司(Figure,特斯拉Optimas、The Bot Company)
以仿真为中心做端到端落地的公司(光轮)
(“特斯拉Optimas的管理文化和π完全不一样”)
01:09:22 美国存在具身模型层的创业机会,中国在我看来字节、小米、理想更适合做“大脑”
01:15:33 老黄在内部说:NV is a simulation company
01:21:25 终局的模型应该是是跨宇宙、跨世界、跨本体(提升跨宇宙的能力,本质是提升泛化性)
01:23:28 具身智能的产业还在GPT-1阶段,还没找到scaling law的配方
01:28:21 我创业刚开始,从具身的本科开始学起
01:37:37 最后的快问快答

【机器人专场】
逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA”
进一步信息揣测
- 合成数据在具身智能中的核心地位:真实数据仅占训练数据的1%,合成数据承担了主要训练任务(银河通用案例),说明行业已高度依赖仿真技术解决数据稀缺问题。
- Sim2Real的隐性挑战:仿真与现实的差距(Sim2Real gap)是关键技术瓶颈,尤其在具身智能领域,物理交互的仿真精度比视觉仿真更难实现(智能驾驶更侧重视觉,而具身智能需解决物理引擎的逼真度)。
- 物理仿真技术的内幕:Real2Sim(真实到仿真)工作流涉及复杂参数校准,成功仿真的评估标准未公开,可能依赖企业自建的黑盒测试体系。
- 行业巨头布局策略:英伟达内部定位为“仿真公司”(老黄原话),暗示其通过Omniverse等工具垄断仿真底层设施;Meta计划300亿美金收购Scale AI,反映合成数据标注平台已成为战略资源。
- 中美产业分工差异:美国具身智能创业集中在模型层(如π、Skild),而中国更适合字节、小米等大厂做“大脑”(基座模型),因硬件整合和场景落地需强资源支持。
- 特斯拉与π的文化冲突:Optimus团队管理风格与π(Physical Intelligence)截然不同,可能指向特斯拉更注重工程迭代,而π偏向学术化探索。
- 合成数据的付费壁垒:高质量合成数据生成依赖专业工具链(如光轮的仿真平台),中小企业可能需付费购买或合作,否则难以达到工业级精度。
- 行业阶段判断:具身智能仍处于“GPT-1阶段”,尚未找到类似大语言的scaling law配方,当前技术路线存在试错成本高的风险。
- 跨宇宙泛化的终极目标:头部公司(如英伟达、DeepMind)已布局跨世界、跨本体的仿真能力,本质是通过多环境训练提升模型泛化性,但技术细节未公开。
- 创业者的学习路径:具身智能领域创业者需从基础物理交互学起(如谢晨自述“从本科开始学”),说明行业门槛极高,经验积累无法速成。