AI News AI资讯 14h ago Updated 1h ago 更新于 1小时前 59

36Kr Exclusive | Tsinghua Team Develops the World's First Foundation Model for Real-time Understanding of Physiology and Emotion, Further Expanding into Hardware 36氪首发 | 清华团队做出全球首个实时理解生理与情绪的基座模型,进一步布局硬件

微面科技获顺为资本数百万美元投资,开发人类感知理解基座模型。 其自研模型FacePhys基于rPPG技术,可实时输出超120项生理指标。 心率检测精度≤2 BPM,达医疗级标准;端侧延迟≤10ms,参数仅0.2M。 技术已与海尔机器人等客户在家庭、康养、仿生机器人及车载领域合作落地。 软硬件一体化布局,推出端侧摄像头模组,强调本地化处理与隐私保护。 北京微面科技完成数百万美元融资,由顺为资本投资,专注人类感知理解基座模型。 其自研FacePhys模型基于rPPG技术,可实时输出超120项生理与情绪指标。 核心指标达医疗级:心率检测精度≤2 BPM,端侧推理延迟≤10ms,模型参数仅0.2M。 解决传统rPPG技术对光照、运动的鲁棒性难题,构建万人级临床标注数据集。 已在家庭机器人、康养、仿生机器人及车载驾驶员监测等场景推进落地。

85
Hot 热度
80
Quality 质量
85
Impact 影响力

Analysis 深度分析

TL;DR

  • 微面科技获顺为资本数百万美元投资,开发人类感知理解基座模型。
  • 其自研模型FacePhys基于rPPG技术,可实时输出超120项生理指标。
  • 心率检测精度≤2 BPM,达医疗级标准;端侧延迟≤10ms,参数仅0.2M。
  • 技术已与海尔机器人等客户在家庭、康养、仿生机器人及车载领域合作落地。
  • 软硬件一体化布局,推出端侧摄像头模组,强调本地化处理与隐私保护。

Key Data

Entity Key Info Data/Metrics
微面科技 公司融资轮次 数百万美元
微面科技 投资方 顺为资本
FacePhys模型 基座模型名称 -
FacePhys模型 实时输出指标数 超过120项
rPPG技术 核心技术 远程光电容积描记
FacePhys模型 心率检测精度 ≤ 2 BPM
FacePhys模型 端侧推理延迟 ≤ 10ms
FacePhys模型 端侧模型参数规模 0.2M
微面科技 数据集规模 万人级临床标注数据集
微面科技 数据采样点 数千万测量采样点
落地客户 家庭机器人合作方 海尔机器人

Deep Analysis

微面科技拿到顺为资本这笔钱,切入的是当前AI交互中一个极其尖锐但少有人正面强攻的缺口:对“非语言信息”的实时感知与理解。文章说人类表达中55%是非语言信息,但大多数AI还停留在“听指令”的层面,这本质上是一种残缺的交互。微面想补上的就是“看见表情下的心跳,听见沉默里的波澜”这关键一环。

他们的技术路线选择很有意思,选择了rPPG(远程光电容积描记)。这条路不好走,光照、头部运动都是天敌。国内同行大多还在“录制视频-上传云端”这个笨重的模式里打转,这根本跟不上实时交互的节奏。微面的突破点在于用“状态空间模型”把心跳预测变成了一个连续物理过程,这就像用一条平滑的函数曲线去拟合心跳,而不是拼凑一张张离散的快照。这个思路是降维打击,直接从信号处理层面拔高了天花板。

更值得玩味的是他们的产品哲学:端侧优先。0.2M的参数、10ms的延迟,直接跑在手机和摄像头模组上。这不仅仅是技术选择,更是产品伦理和商业落地的深思熟虑。生理和情绪数据极度敏感,全上云在医疗、家庭场景中是红线。端侧处理,把“算力”和“数据”都锁在本地设备,既是给用户安全感,也是为自己构建护城河——数据不出门,模型更懂你。这和当前许多云端大模型的路径背道而驰,却可能更贴近真实世界的需求。

“医疗级精度”是另一个狠招。≤2 BPM的心率精度,意味着从消费级玩具升级到了专业工具。这打开了医院筛查、健康管理的严肃市场大门,也直接把技术价值锚定在了高壁垒领域。与安贞医院的合作和万人级临床数据集,是其构建技术可信度的关键基石,这可不是靠爬虫数据或合成数据能速成的。

团队背景(清华系,医工交叉)和投资人(顺为,强生态协同)也透露出清晰的战略意图。这不是一个纯算法公司,而是奔着“人机交互基座”去的。在机器人、智能座舱、健康设备这些顺为和小米生态链深度布局的赛道里,微面提供的“感知-理解-共情”能力,恰是实现“主动智能”那一环缺失的拼图。他们的竞争对手,表面看是FaceHeart这样的公司,但更深层的,是传统的人机交互范式,以及那些只能处理“显性输入”的AI系统。

微面的挑战同样真实:如何定义并证明“非语言信息理解”的普适性价值?HRV和情绪之间的映射是科学的,但也是复杂的、个体差异巨大的。将“假笑”和“压抑情绪”客观量化,需要极强的领域知识和数据壁垒。此外,硬件模组的量产和成本控制,将是决定其能否从“技术验证”迈向“规模普及”的下一关。

Industry Insights

  1. 人机交互正从“命令响应”转向“状态感知”,隐性生理数据将成为下一代智能体的核心输入维度。
  2. “端侧智能”在隐私敏感领域将成主流,高精度、低延迟的小模型比云端大模型更具落地优势。
  3. “医疗级精度”是消费技术建立信任与壁垒的关键跳板,跨过这条线,应用空间指数级放大。

FAQ

Q: 这项技术和用摄像头做表情识别有什么区别?
A: 表情识别是“看”面部肌肉的几何变化,属于视觉分类;微面的技术是“透皮”测量血液流动,获取心率、HRV等生理信号。前者能识别“笑”,后者能区分“真笑”和“假笑”背后的生理状态差异,信息维度和深度完全不同。

Q: 端侧处理是否意味着准确度会下降?
A: 恰恰相反。微面通过状态空间模型优化和轻量化架构,将医疗级精度(≤2 BPM)压缩到0.2M参数的端侧模型中,同时实现了10ms内的极低延迟。其优势在于去除了云端传输的延迟和噪声干扰,响应更实时、更可靠。

Q: 这项技术会如何被滥用?隐私风险在哪?
A: 这正是其强调端侧处理的核心原因。生理情绪数据极其敏感,在本地处理、不上传云端,可以从架构上杜绝数据在传输和集中存储中的泄露风险。但任何生物信息采集都存在潜在风险,关键在于明确告知、授权与数据最小化原则。

TL;DR

  • 北京微面科技完成数百万美元融资,由顺为资本投资,专注人类感知理解基座模型。
  • 其自研FacePhys模型基于rPPG技术,可实时输出超120项生理与情绪指标。
  • 核心指标达医疗级:心率检测精度≤2 BPM,端侧推理延迟≤10ms,模型参数仅0.2M。
  • 解决传统rPPG技术对光照、运动的鲁棒性难题,构建万人级临床标注数据集。
  • 已在家庭机器人、康养、仿生机器人及车载驾驶员监测等场景推进落地。

核心数据

实体 关键信息 数据/指标
微面科技 本轮投资方 顺为资本
FacePhys模型 实时输出生理与情绪指标项 超过120项
核心指标 心率检测精度 ≤2 BPM
核心指标 端侧推理延迟 ≤10ms
核心指标 端侧小模型参数规模 0.2M
临床数据集 数据集规模与构成 万人级,覆盖不同肤色及复杂场景
情绪识别维度 融合指标 HRV、面部动作单元、眼动、语音特征等

深度解读

微面科技这轮融资和技术路线,直接刺向了当前人机交互领域一个最尴尬、也最根本的痛点:机器的“失明”与“失聪”。我们花了大把力气让AI听懂人话(LLM)、看懂人形(视觉),但它始终是个“直男式”的反应器——你明确说了“我痛”,它才会回应;而你眉头紧锁、心率飙升的隐忍,它完全视而不见。55%的非语言信息鸿沟,就是AI从“工具”迈向“伴侣”之间那道看不见却深不见底的沟壑。

微面科技的解法很硬核:绕开主观的情绪标签,直接抓取客观的生理真相。用rPPG技术从视频里“抠”出心率、HRV这些无法伪装的生命体征数据,再喂给大模型。这相当于给AI装上了一个无需接触的“听诊器”和“情绪仪表盘”。创始人把心跳建模成连续物理过程,而不是离散帧,思路确实巧妙,这抓住了生物信号最本质的连续性和周期性特征。2 BPM的医疗级精度和0.2M的轻量化参数,更是把技术从实验室概念直接拽向了规模化量产的门槛。

但兴奋之余,必须看到这条路径上布满了“地雷”。首先,数据是金矿,也是护城河。他们引以为傲的万人级临床数据库,这恰恰是大多数做大模型的公司最薄弱、也最不愿意碰的脏活累活。医学数据的获取、清洗、合规(尤其是涉及生理和情绪这种敏感隐私信息)成本极高。微面科技的清华背景和医院合作是其前期关键优势,但这能形成多深的壁垒?随着巨头入场,数据竞赛会立刻白热化。

其次,“端侧为王”的战略选择极具前瞻性,但也意味着重资产运营的挑战。他们清醒地认识到生理数据的隐私敏感性和实时性要求,选择推嵌入式模组和端侧模型。这没错,但硬件意味着供应链、品控、渠道,从软件公司跨界到硬件量产,难度是指数级增长的。他们目前的落地方式(SDK/API + 模组)更像是一个“交钥匙”的解决方案提供商,这能快速铺开,但利润空间和客户粘性可能受制于上游的机器人或车厂巨头。

最后,也是最尖锐的一点:技术的“炫酷感”与商业场景的“刚需性”之间,可能存在巨大温差。能识别假笑和压抑情绪,技术上很惊艳。但对于购买家庭机器人或车载系统的消费者来说,这个功能是“哇塞,好酷!”还是“我为什么要为这个多付2000块钱?”?目前的商业故事更偏向于“赋能”,比如让机器人交互更自然、让车机更安全。但真正的“杀手级应用”在哪?是心理治疗辅助?还是高端安防?微面需要证明,从“能做”到“必须用”,中间的商业逻辑是通畅的。顺为资本押注“人车家全场景协同”,显然是看中了小米生态的嫁接潜力,但其他客户会买账吗?

总而言之,微面科技做了一件正确且困难的事:为冰冷的机器智能注入生理的、可感知的“体征”。它不是在做一个锦上添花的附加功能,而是在构建下一代人机交互的底层数据入口。这场豪赌如果成功,我们未来与机器的关系,将从“指令-响应”的冷交互,迈向“感知-共情”的热交互。但横亘在前的,是医疗级的数据合规、硬件量产的血海,以及一个必须用真金白银来验证的场景需求。

行业启示

  1. 生理数据将成为人机交互的核心数据维度:非语言、非接触的生理信息(如心率、HRV、微表情)将不再是研究概念,而是成为与语音、视觉同等重要的输入源,迫使大模型从“语言智能”向“具身智能”进化。
  2. 端侧计算能力是隐私与实时性的必选项:对于生理、情绪等敏感数据的处理,云端中心化模式将面临日益严峻的法规与隐私挑战,“端侧感知-推理,云端协同”的混合架构将成为智能硬件的标配。
  3. 从“感知”到“理解”需要跨界临床验证:单纯的算法精度不足以建立信任,在医疗健康、车载安全等严肃场景,与权威医疗机构合作进行临床验证、构建高质量数据集,将成为技术公司建立壁垒和可信度的关键。

FAQ

Q: 微面科技的核心技术rPPG与其他情绪识别技术有何不同?
A: 传统情绪识别多依赖表情识别(易伪装)或语音分析。rPPG通过分析面部视频中的微小颜色变化来获取心率、HRV等客观生理指标,这些是更难伪装的“生理真相”,能提供更底层、更真实的状态数据。

Q: 他们声称的“全球唯一性”是否站得住脚?
A: “唯一性”更多指其将rPPG生理感知、状态空间模型架构、轻量化端侧推理以及面向人机交互的多模态融合整合在一个基座模型中。国外有类似技术(如FaceHeart)但侧重医疗监测,国内方案多依赖云端且实时性不足,其差异在于系统级整合与工程化落地能力。

Q: 这项技术目前主要应用在哪些领域?
A: 目前主要落地三大场景:1)家庭与服务机器人,提升交互自然度;2)康养机器人,用于快速健康筛查;3)智能座舱,作为驾驶员疲劳与状态监测方案。同时也在为科研和医疗提供数据采集硬件。

Disclaimer: The above content is generated by AI and is for reference only. 免责声明:以上内容由 AI 生成,仅供参考。

大模型 大模型 多模态 多模态 产品发布 产品发布 融资 融资
Share: 分享到: