AI News AI资讯 17h ago Updated 2h ago 更新于 2小时前 48

Tsinghua-linked Team Develops Distributed Predictive World Model, Secures Hundreds of Millions Yuan in A-Round Financing, Deploys to Tens of Thousands of Terminal Devices | Hard Krypton Exclusive 清华系团队做分布式预测世界模型、获数亿元A轮融资,落地终端设备达十万量级|硬氪首发

千诀科技完成数亿元A轮融资,由京铭资本领投。 公司主打预测式世界模型,反对主流生成式路线,主打“低维状态预测”。 技术架构为分布式预测,宣称能降低数据需求,实现多硬件解耦适配。 已在酒店、咖啡店等场景部署十万台设备,强调闭环反馈与低延迟。 具身智能公司“千诀科技”完成数亿元A轮融资,由京铭资本领投。 公司主攻“预测式”世界模型,认为其优于生成式路线,能避免特征污染。 采用分布式预测架构,将模型对示教数据的需求从1000个降至100个“状态-动作对”。 自研具身大脑已适配轮式、四足、人形机器人等多品类硬件,接入终端设备达十万台。 融资将用于模型迭代、团队扩充和商业化落地,强调0.5秒内的低延迟响应是关键体验。

70
Hot 热度
70
Quality 质量
65
Impact 影响力

Analysis 深度分析

TL;DR

  • 千诀科技完成数亿元A轮融资,由京铭资本领投。
  • 公司主打预测式世界模型,反对主流生成式路线,主打“低维状态预测”。
  • 技术架构为分布式预测,宣称能降低数据需求,实现多硬件解耦适配。
  • 已在酒店、咖啡店等场景部署十万台设备,强调闭环反馈与低延迟。

Key Data

Entity Key Info Data/Metrics
千诀科技 融资轮次 A轮
千诀科技 融资金额 数亿元
千诀科技 创立时间 2023年6月
千诀科技 核心团队来源 清华大学类脑研究中心
千诀科技 已部署终端设备规模 十万台
千诀科技 世界模型推理速度 0.5秒内
千诀科技 云端传输延迟 (部分案例) 1秒左右
预测式模型 (对比) 样本效率提升 (宣称) 从1000个“状态-动作”对降至100个

Deep Analysis

千诀科技的技术选择,本质上是一场对行业主流思潮的“叛逆”。当大多数玩家在视频生成式世界模型的道路上狂奔,试图用像素级的重构来理解物理世界时,千诀直接指出了这条路径的阿喀琉斯之踵——特征污染。这个批判相当精准。让模型为了预测下一帧的光影纹理而强行拟合所有信息,确实像是在让一位物理学家通过临摹每一幅静物画来学习力学定律,效率低下且容易迷失。CTO章天任用“人脑看图不会平均分配注意力”来类比,这恰恰点出了生成式范式与人类认知的根本脱节。

千诀给出的答案——预测物理状态的低维演化轨迹——初看颇具哲学意味。用打乒乓球的例子来说服投资人非常聪明:我们挥拍依靠的是对球体轨迹和速度的抽象预测,而非脑内高清渲染的逐帧动画。这个比喻将复杂的技术路线“降维”到了常识层面。然而,这里的“低维特征”究竟是什么?是物体的质心、速度矢量,还是更抽象的几何关系?千诀没有明说,但这层“抽象”恰恰是其技术黑箱的核心。他们试图跳过“像”,直取“神”,即物理规律本身。

其分布式预测架构是另一个关键创新点。模仿大脑的分区处理,试图解决端到端模型“把所有信息揉在一起”的臃肿和低效。这看起来非常工程化和务实:将感知、预测模块化,通过区域间的协同与独立来提升样本效率和推理速度。宣称能将训练数据需求从1000个样本降到100个,如果属实,这在需要大量真实交互数据的机器人领域将是巨大优势。但这同样带来了挑战:如何定义和划分这些“区域”?区域间信息的传递与同步又如何保证一致性?这更像是在搭建一个复杂的精密仪器,对系统工程的要求极高。

最务实的一步,或许是他们将“具身大脑”与“小脑”解耦的设计。这意味着同一个决策大脑可以快速适配轮式、四足、人形等完全不同的机器人本体。这解决了行业一个真实痛点:为每种机器人从头训练一个大脑模型是资源巨大的浪费。这种解耦,使得千诀可以聚焦于他们擅长的“思考”层,而将执行层留给硬件厂商,是一种聪明的平台化思维。

十万台的部署规模是这份材料里最硬的底气。它意味着千诀并非停留在实验室和PPT阶段,而是已经接受了真实商业场景的残酷检验。CEO高海川提到的两个“超出预期”极其宝贵:第一,延迟比模型能力更重要。在机器人场景,0.5秒的推理与1秒的云端传输带来的体验天壤之别,这暴露了当前AI行业普遍重算法轻系统的短板。第二,主动性是产品化的灵魂。客户要的不是被动工具,而是能“眼里有活”的智能体。这两个反馈直指具身智能商业化的核心——它从来不是一个纯粹的AI问题,而是一个极致的工程、体验与产品定义问题。

最后,关于误差累积的问答揭示了具身智能与视频生成的本质区别:闭环。机器人是在与物理世界持续交互、不断修正中完成任务的,这天然抑制了纯开环预测的致命缺陷。千诀选择“边做边看”,而非规划完美的超长序列,这是一种对真实世界复杂性的敬畏。他们的世界模型,或许更接近一个“实时决策辅助系统”,而非一个全知的“先知”。这种定位,可能比追求完美的理论模型,更接近通用人工智能落地物理世界的正确路径。

Industry Insights

  1. 机器人“智能化”标准正从指令执行精度转向环境主动感知与决策能力。 产品差异化将体现在“眼里有活”的自主性上。
  2. 技术路线选择需深度锚定真实商业约束。 延迟、数据成本、跨本体迁移能力等工程指标,可能比模型理论性能更决定落地成败。
  3. 解耦的模块化架构(大脑/小脑分离)将成为平台型公司的关键壁垒。 它能快速整合硬件生态,构建数据飞轮。

FAQ

Q: 预测式世界模型和主流的生成式世界模型有什么核心区别?
A: 生成式模型通过像素级重构预测下一帧画面,容易混入无关噪声(特征污染)。预测式模型则专注于预测物理状态(如轨迹、受力)的低维演化规律,输出是抽象特征而非图像,更直接服务于动作规划。

Q: 千诀科技声称的十万台设备部署,意味着什么?
A: 这意味着其技术已经过大规模、多场景的真实商业环境验证,积累了宝贵的闭环交互数据。这使其模型训练不存在“实验室与现实的鸿沟”,且产品化能力(如延迟优化、用户体验)得到了实战打磨。

Q: 对于其他具身智能创业公司,千诀的路径有何启示?
A: 启示在于:1) 选择与真实场景约束紧密契合的技术路线(如低延迟)可能比追逐最前沿理论更易存活;2) 通过架构创新(如解耦、分布式)解决数据效率和跨平台复用问题至关重要;3) 产品的成功最终定义在“主动服务”体验,而非单一技术指标。

TL;DR

  • 具身智能公司“千诀科技”完成数亿元A轮融资,由京铭资本领投。
  • 公司主攻“预测式”世界模型,认为其优于生成式路线,能避免特征污染。
  • 采用分布式预测架构,将模型对示教数据的需求从1000个降至100个“状态-动作对”。
  • 自研具身大脑已适配轮式、四足、人形机器人等多品类硬件,接入终端设备达十万台。
  • 融资将用于模型迭代、团队扩充和商业化落地,强调0.5秒内的低延迟响应是关键体验。

核心数据

实体 关键信息 数据/指标
千诀科技 A轮融资额 数亿元
千诀科技 投资方 京铭资本领投,山东新动能、元禾厚望等十多家机构
千诀科技 终端设备接入规模 十万台
分布式预测架构 数据效率提升 将模型所需“状态-动作”对从1000个降至100个
千诀科技 模型推理延迟 可在0.5秒内返回结果

深度解读

具身智能的“世界模型”赛道,终于迎来了技术路线上的第一次严肃分野。当大部分玩家还在生成式路径上卷像素级复原时,千诀科技直接抛出了一个尖锐命题:你是在理解世界,还是在复刻表象?他们的“预测式”世界模型,本质上是一次对物理本质的回归——机器人需要的不是下一帧像素的幻觉,而是下一个物理状态的向量。

CTO章天任提到的“特征污染”问题,堪称对当前视觉生成范式的一记精准打击。为了追求“无损重构”,模型被迫将光影、纹理等与任务无关的噪声信息和有效特征强行捆绑,这就像教一个孩子认路,却强迫他记住路面上每一片落叶的形状,结果反而让他迷路。预测式模型选择“看穿”像素,直接建模低维状态演化,这是一种更接近人类小脑与运动皮层协作的思路:打球时,我们不会在脑中渲染每一帧高清画面,而是基于物理直觉(球速、角度、风阻)直接挥拍。

更值得关注的是其“分布式预测架构”。这跳出了单一大模型压缩处理所有信息的惯性思维,转而模仿人脑的“分区-协同”机制。其核心优势不仅在于更高的样本效率(数据需求降90%),更在于其与“大脑-小脑”解耦设计的协同。这种架构让千诀的“大脑”可以作为一个通用感知-预测模块,像U盘一样快速插在不同“身体”(轮式、人形、无人机)上。这是构建可迁移“具身基座模型”的关键,也是其迅速铺开十万台设备的前提。

然而,十万台设备的数据闭环是金矿,也可能是陷阱。CEO高海川强调“不存在real-to-real gap”,这固然是优势,但海量低复杂度场景(如酒店保洁、配送)的数据,是否会把模型的泛化能力“锁死”在这些特定领域?面对长尾、高动态的极端场景,这种数据飞轮能否顺利加速,是千诀从“规模化落地”迈向“通用化智能”必须跨越的鸿沟。

此外,他们对“毫秒级延迟”和“主动智能”的洞察,暴露了技术演示与真实商业场景的巨大鸿沟。实验室里,模型能力是首要指标;在酒店、餐厅,比别人快0.5秒完成决策、能自己“眼里有活”,才是客户愿意付费的体验跃迁。千诀的务实,恰恰体现在对“智能体”而非“智能玩具”的定位上。

行业启示

  1. 技术路线将加速分化:“生成式”与“预测式”路线之争从论文走向产品,市场将检验哪种范式更贴合物理世界的低维本质与实时响应需求。
  2. 数据规模与场景质量同等重要:拥有十万台终端形成的“冷启动”数据优势巨大,但未来竞争将取决于数据能否覆盖足够丰富、复杂的长尾场景。
  3. 商业落地的胜负手在“非技术指标”:响应延迟、主动决策能力等用户体验细节,其商业权重可能超过模型在基准测试上的分数,这要求团队具备极强的产品与工程化基因。

FAQ

Q: 千诀科技的“预测式世界模型”和主流的“生成式世界模型”最核心的区别是什么?
A: 核心区别在于输出物。生成式模型试图还原下一帧的完整像素画面,而预测式模型直接预测物理状态的低维演化轨迹(如位置、速度向量),更注重物理规律的提取而非图像复刻,从而避免特征污染并降低计算负担。

Q: 公司提到的“十万台终端设备”带来的数据飞轮,具体如何反哺模型迭代?
A: 这十万台设备在真实服务场景(如酒店、商场)中持续产生交互与决策数据,形成了高价值的“状态-动作”闭环数据集。这些数据能帮助模型学习更真实、多样化的物理世界变化规律,不断优化其预测和规划能力,形成“落地-数据-优化-再落地”的正向循环。

Q: 在实际商业落地中,客户最看重的,除了模型性能还有什么?
A: 除了基础的感知和规划能力,客户极其看重响应延迟(需低至0.5秒内)和机器人的主动性。能否在无需指令的情况下“眼里有活”、自主决策,是实现从“工具”到“智能体”体验跃迁的关键,直接影响客户付费意愿。

Disclaimer: The above content is generated by AI and is for reference only. 免责声明:以上内容由 AI 生成,仅供参考。

机器人 机器人 融资 融资 大模型 大模型
Share: 分享到: