AI News AI资讯 8h ago Updated 2h ago 更新于 2小时前 52

Hardcore Interview | Luo Jianlan: The True Scaling Law for Robots Happens in the Closed Loop of Real Deployment 硬氪专访 | 罗剑岚:机器人真正的Scaling Law,发生在真实部署闭环里

罗剑岚判断:多数“预训练”实为微调或中训练。 真正突破需形成“部署-数据-迭代”闭环飞轮。 未来12-18个月,半结构化场景是关键验证窗口。 硬件不再是核心瓶颈,数据闭环能力是短板。 反对盲目对标GPT式Scaling Law,部署效能是金标准。 具身智能行业重心正从硬件“自由度竞赛”转向软件与闭环构建。 智元机器人首席科学家罗剑岚指出,当前行业多为“中训练”或微调,远非真正的具身基础模型预训练。 具身智能的突破关键在于构建“部署—数据—迭代”的闭环飞轮,而非单纯堆砌数据。 当前高质量、可用于闭环部署的机器人数据计量标准未统一,行业规模仍远不足。 决胜点可能在未来12到18个月,谁能率先在半结构化场景跑通闭环谁将胜出。

75
Hot 热度
80
Quality 质量
70
Impact 影响力

Analysis 深度分析

TL;DR

  • 罗剑岚判断:多数“预训练”实为微调或中训练。
  • 真正突破需形成“部署-数据-迭代”闭环飞轮。
  • 未来12-18个月,半结构化场景是关键验证窗口。
  • 硬件不再是核心瓶颈,数据闭环能力是短板。
  • 反对盲目对标GPT式Scaling Law,部署效能是金标准。

Key Data

Entity Key Info Data/Metrics
罗剑岚 智元机器人首席科学家、上海创智学院副教授,前Google X与DeepMind研究科学家,伯克利博士,师从Sergey Levine。 14个月前回国加入创智学院和智元机器人。
τ0-WM世界模型 上海创智学院与智元机器人联合发布。定位为动作条件物理推演器。 目标:在执行前比较候选动作的未来后果。

Deep Analysis

罗剑岚的判断像一盆冷水,浇在了当前稍显过热的具身智能叙事上。他直指行业核心的“认知错位”:将适用于互联网文本的“预训练-微调”范式,生硬套用到需要与物理世界交互的机器人领域。这不仅仅是概念混淆,它导致了一条看似高效却可能根基不稳的技术路径。当团队在开源底座上堆砌高质量遥操数据,在特定任务上刷出漂亮的离线Loss曲线时,很容易产生“基础模型已成”的幻觉。但Loss下降,本质上只是模型更“听话”地复述了喂给它的数据,这与机器人能否在未知扰动下稳定抓取、在失败后自主纠正,完全是两码事。物理世界的“长尾”是无穷的,而静态数据集是有限的。这种路径在实验室里跑通Demo很快,但离真正的通用智能,可能南辕北辙。

因此,罗剑岚将“闭环”提升至最高优先级,是一种深刻的范式纠偏。他设想的“SOP(可扩展在线后训练)”和“LWD(部署中学习)”,核心是打破了“研发-部署”的单向流水线,将生产线本身变成了研发的延伸。这要求机器人出厂不是定型,而是一个学习的开始。这彻底改变了智能的生长模式:不是先有完美的“大脑”,再去指挥身体;而是让“身体”在探索世界的过程中,反过来喂养和塑造“大脑”。这更像是生物进化的逻辑,而非软件迭代的逻辑。他的τ0-WM世界模型,则是这个闭环中的“预演沙盒”,让机器人在动作执行前进行“认知模拟”,从而减少危险、无效的真实世界试错。这套组合拳,瞄准的是数据从何而来、如何流动、如何增值的根本问题。

罗剑岚划定的“未来12到18个月”的时间窗口,冷静而残酷。他赌的不是一个算法奇点,而是一个商业与技术验证的临界点——即在便利店、商超等半结构化场景,能否证明“部署得越多,模型越好用,且新场景适配成本越低”。一旦这个飞轮转动的证据链成立,它将重塑整个行业的资本流向和竞争格局。这意味着,纯粹的算法炫技或硬件参数竞赛将黯然失色,系统的全栈整合与快速迭代能力成为新王道。对于创业公司而言,这反而是机会。大厂的复杂决策链条可能使其错过这个稍纵即逝的“第一信号”捕捉期。

从中国产业视角看,罗剑岚的归国选择与智元机器人的路径,极具战略意味。中国的优势不在于发明基础理论,而在于极快的工程化闭环能力:强大的供应链能迅速将机器人铺到真实场景,丰富的商业场景提供了宝贵的试炼场。如果能跑通这个“数据飞轮”,就相当于将中国的制造业效率优势,转化为AI时代的数据生成与迭代效率优势。但最大的风险也在于此:如果行业集体陷入对“Scaling Law”的盲目崇拜,沉迷于在仿真和视频数据上刷榜,而忽视了真实交互数据的闭环构建,我们可能会在通往“具身智能”的路上,被自己制造的数据泡沫所迷惑。最终,衡量成功的唯一标准,将是机器人的“手感”与“常识”,而不是论文里的Loss曲线。

Industry Insights

  1. 数据计量标准亟需统一:行业需明确区分仿真、视频、遥操、真实交互等不同类型数据,建立通用计量口径,否则无法科学评估模型真实能力。
  2. “硬件够用,闭环为王”:在半结构化场景,硬件迭代应服务于数据闭环构建,核心投入应转向在线学习基础设施与部署中学习算法。
  3. 验证窗口收窄:未来12-18个月,是否跑通“部署-数据-迭代”正向循环,将成为区分概念公司与实干家的分水岭,半结构化场景是最佳试验田。

FAQ

Q: 为什么罗剑岚认为现在的“具身基础模型”训练不算真正的预训练?
A: 因为当前高质量真机交互数据稀缺,多数团队是用开源底座加上特定任务的遥操数据进行微调或“中训练”,目的是适配任务,而非用海量异构数据学习广泛的物理世界交互规律。

Q: 他所说的“闭环”具体指什么?和传统机器人开发有何不同?
A: 闭环指机器人真实部署产生的数据,能实时反馈并持续优化模型,形成“部署越多-数据越多-模型越强-再部署更多”的飞轮。传统模式是“研发-出厂-结束”,新模式是“部署-学习-进化”。

Q: 世界模型和VLA(视觉-语言-动作模型)是竞争关系吗?
A: 不是。罗剑岚认为语言是高层规划不可或缺的接口,VLA强在逻辑拆解。世界模型(特别是动作条件预测模型)强在物理推演,二者融合才能实现从宏观规划到精准执行的完整能力,是互补而非替代关系。

TL;DR

  • 具身智能行业重心正从硬件“自由度竞赛”转向软件与闭环构建。
  • 智元机器人首席科学家罗剑岚指出,当前行业多为“中训练”或微调,远非真正的具身基础模型预训练。
  • 具身智能的突破关键在于构建“部署—数据—迭代”的闭环飞轮,而非单纯堆砌数据。
  • 当前高质量、可用于闭环部署的机器人数据计量标准未统一,行业规模仍远不足。
  • 决胜点可能在未来12到18个月,谁能率先在半结构化场景跑通闭环谁将胜出。

核心数据

实体 关键信息 数据/指标
罗剑岚 身份背景 上海创智学院副教授、智元机器人首席科学家,师从Sergey Levine
关键时间窗口 决胜点预判 未来12到18个月
SOP 技术成果 面向大规模机器人在线后训练的基础设施(概念验证阶段)
LWD 技术成果 部署中学习系统,用于机器人后训练和自我进化
τ0-WM 技术成果 动作条件的世界模型,用于预测动作后果,非最终视频生成目标
行业共识 数据现状 高质量真机交互数据稀缺,行业数据计量口径不统一(视频、轨迹、仿真等)

深度解读

罗剑岚的判断像一盆冷水,泼在了当下被资本和概念催熟、略显浮躁的具身智能赛道上。他点破了一个皇帝的新衣:行业里熙熙攘攘的“具身基础模型”训练,大多只是在开源底座上做数据适配的“中训练”或“微调”,距离真正吸纳异构、含噪真实数据的预训练阶段还很远。这本质上反映了行业的焦虑——在缺乏海量高质量真机交互数据的阶段,大家急于用LLM的“成功故事”来自我安慰和对外叙事,却忽视了物理世界交互数据与文本数据在获取成本、结构和本质规律上的天壤之别。

罗剑岚的犀利之处在于,他跳出了“数据、模型、Infra哪个更重要”的争论陷阱,直指问题的核心是系统性闭环。他描绘的“部署-数据-迭代”飞轮,才是具身智能真正的“Scaling Law时刻”。这不仅仅是技术路径的选择,更是一种工程哲学和商业逻辑的彻底转变:机器人不再是工厂里出厂即定型的标准化产品,而是部署在便利店、超市里,会随着环境反馈持续进化的“生命体”。这种模式下,数据的定义被重构了——不再是实验室里采集的完美轨迹,而是包含大量失败、纠错和长尾扰动的真实交互记录。这对数据回流的基础设施(如他提出的SOP)和在线学习能力(如LWD)提出了极高要求。

他对世界模型(World Model)的解读也极具“祛魅”价值。他坚决剥离了当前流行的、以视频生成为导向的世界模型概念,将其锚定为“动作条件的预测模型”——一个能在虚拟空间中评估动作后果的“物理推演器”。这才是机器人规划决策所急需的“先验知识”。同时,他捍卫了VLA(视觉-语言-动作模型)中“语言”的不可或缺性,认为它是处理复杂长程任务的最高阶接口。他提出的未来图景——VLA负责宏观规划,世界模型保障微观物理执行精度——可能为“VLA已死”的争论提供了一个更具建设性的融合方向。

最后,他将胜利的时钟拨响:未来12-18个月。这个窗口期的设定,暗示了技术收敛的可能性和资本耐心的临界点。谁能在便利店、仓储等半结构化场景,率先证明其数据飞轮真的能越转越快、适配成本越来越低,谁就将拿到这张通往万亿市场的头等舱票。这不再是PPT上的愿景,而是对硬件、软件、数据、场景理解和工程化能力的一场极限综合考验。罗剑岚和智元机器人,正试图用这套“闭环木桶”理论,在这场竞赛中定义新的游戏规则。

行业启示

  1. 重新定义数据标准:行业需尽快收敛机器人交互数据的计量口径,区分视频、轨迹、仿真数据的价值差异,建立以“可驱动闭环迭代的真实交互数据”为核心的质量评估体系。
  2. 从“模型崇拜”转向“闭环验证”:评价团队价值不应只看模型参数或论文指标,而应审视其数据回流、在线学习与快速部署验证的全链条能力,聚焦于“部署-数据-迭代”飞轮的实际转速。
  3. 融合式架构是未来:放弃对单一技术路线(如VLA vs 世界模型)的执念,探索将语言驱动的高层规划与物理动力学预测深度融合的混合智能架构。

FAQ

Q: 罗剑岚认为现在大部分团队的训练都不是真正的“预训练”,这个判断对吗?
A: 他的判断基于行业现状。当前多数团队在高质量真机数据匮乏的条件下,确实在更接近“中训练”或微调的阶段工作,主要任务是数据对齐,而非在广泛、异构数据上进行从零到一的预训练。

Q: 构成具身智能“闭环飞轮”最大的难点是什么?
A: 最大难点在于从“离线训练”到“在线持续学习”的跨越,这需要构建一套低延迟、高可靠的数据回流、模型更新和部署验证的全栈基础设施,并在真实商业场景中证明其经济可行性。

Q: 世界模型和VLA到底是什么关系,未来会取代VLA吗?
A: 两者目前是互补关系。罗剑岚认为VLA在语言理解和高层规划上不可或缺,而世界模型则在动作预测和物理世界建模上提供关键补充。未来更可能是两者的融合,而非一方取代另一方。

Disclaimer: The above content is generated by AI and is for reference only. 免责声明:以上内容由 AI 生成,仅供参考。

机器人 机器人 大模型 大模型 部署 部署
Share: 分享到: