36Kr Exclusive | Tsinghua Team Develops the World's First Foundation Model for Real-time Understanding of Physiology and Emotion, Further Expanding into Hardware
微面科技获顺为资本数百万美元投资,开发人类感知理解基座模型。 其自研模型FacePhys基于rPPG技术,可实时输出超120项生理指标。 心率检测精度≤2 BPM,达医疗级标准;端侧延迟≤10ms,参数仅0.2M。 技术已与海尔机器人等客户在家庭、康养、仿生机器人及车载领域合作落地。 软硬件一体化布局,推出端侧摄像头模组,强调本地化处理与隐私保护。
Analysis
TL;DR
- 微面科技获顺为资本数百万美元投资,开发人类感知理解基座模型。
- 其自研模型FacePhys基于rPPG技术,可实时输出超120项生理指标。
- 心率检测精度≤2 BPM,达医疗级标准;端侧延迟≤10ms,参数仅0.2M。
- 技术已与海尔机器人等客户在家庭、康养、仿生机器人及车载领域合作落地。
- 软硬件一体化布局,推出端侧摄像头模组,强调本地化处理与隐私保护。
Key Data
| Entity | Key Info | Data/Metrics |
|---|---|---|
| 微面科技 | 公司融资轮次 | 数百万美元 |
| 微面科技 | 投资方 | 顺为资本 |
| FacePhys模型 | 基座模型名称 | - |
| FacePhys模型 | 实时输出指标数 | 超过120项 |
| rPPG技术 | 核心技术 | 远程光电容积描记 |
| FacePhys模型 | 心率检测精度 | ≤ 2 BPM |
| FacePhys模型 | 端侧推理延迟 | ≤ 10ms |
| FacePhys模型 | 端侧模型参数规模 | 0.2M |
| 微面科技 | 数据集规模 | 万人级临床标注数据集 |
| 微面科技 | 数据采样点 | 数千万测量采样点 |
| 落地客户 | 家庭机器人合作方 | 海尔机器人 |
Deep Analysis
微面科技拿到顺为资本这笔钱,切入的是当前AI交互中一个极其尖锐但少有人正面强攻的缺口:对“非语言信息”的实时感知与理解。文章说人类表达中55%是非语言信息,但大多数AI还停留在“听指令”的层面,这本质上是一种残缺的交互。微面想补上的就是“看见表情下的心跳,听见沉默里的波澜”这关键一环。
他们的技术路线选择很有意思,选择了rPPG(远程光电容积描记)。这条路不好走,光照、头部运动都是天敌。国内同行大多还在“录制视频-上传云端”这个笨重的模式里打转,这根本跟不上实时交互的节奏。微面的突破点在于用“状态空间模型”把心跳预测变成了一个连续物理过程,这就像用一条平滑的函数曲线去拟合心跳,而不是拼凑一张张离散的快照。这个思路是降维打击,直接从信号处理层面拔高了天花板。
更值得玩味的是他们的产品哲学:端侧优先。0.2M的参数、10ms的延迟,直接跑在手机和摄像头模组上。这不仅仅是技术选择,更是产品伦理和商业落地的深思熟虑。生理和情绪数据极度敏感,全上云在医疗、家庭场景中是红线。端侧处理,把“算力”和“数据”都锁在本地设备,既是给用户安全感,也是为自己构建护城河——数据不出门,模型更懂你。这和当前许多云端大模型的路径背道而驰,却可能更贴近真实世界的需求。
“医疗级精度”是另一个狠招。≤2 BPM的心率精度,意味着从消费级玩具升级到了专业工具。这打开了医院筛查、健康管理的严肃市场大门,也直接把技术价值锚定在了高壁垒领域。与安贞医院的合作和万人级临床数据集,是其构建技术可信度的关键基石,这可不是靠爬虫数据或合成数据能速成的。
团队背景(清华系,医工交叉)和投资人(顺为,强生态协同)也透露出清晰的战略意图。这不是一个纯算法公司,而是奔着“人机交互基座”去的。在机器人、智能座舱、健康设备这些顺为和小米生态链深度布局的赛道里,微面提供的“感知-理解-共情”能力,恰是实现“主动智能”那一环缺失的拼图。他们的竞争对手,表面看是FaceHeart这样的公司,但更深层的,是传统的人机交互范式,以及那些只能处理“显性输入”的AI系统。
微面的挑战同样真实:如何定义并证明“非语言信息理解”的普适性价值?HRV和情绪之间的映射是科学的,但也是复杂的、个体差异巨大的。将“假笑”和“压抑情绪”客观量化,需要极强的领域知识和数据壁垒。此外,硬件模组的量产和成本控制,将是决定其能否从“技术验证”迈向“规模普及”的下一关。
Industry Insights
- 人机交互正从“命令响应”转向“状态感知”,隐性生理数据将成为下一代智能体的核心输入维度。
- “端侧智能”在隐私敏感领域将成主流,高精度、低延迟的小模型比云端大模型更具落地优势。
- “医疗级精度”是消费技术建立信任与壁垒的关键跳板,跨过这条线,应用空间指数级放大。
FAQ
Q: 这项技术和用摄像头做表情识别有什么区别?
A: 表情识别是“看”面部肌肉的几何变化,属于视觉分类;微面的技术是“透皮”测量血液流动,获取心率、HRV等生理信号。前者能识别“笑”,后者能区分“真笑”和“假笑”背后的生理状态差异,信息维度和深度完全不同。
Q: 端侧处理是否意味着准确度会下降?
A: 恰恰相反。微面通过状态空间模型优化和轻量化架构,将医疗级精度(≤2 BPM)压缩到0.2M参数的端侧模型中,同时实现了10ms内的极低延迟。其优势在于去除了云端传输的延迟和噪声干扰,响应更实时、更可靠。
Q: 这项技术会如何被滥用?隐私风险在哪?
A: 这正是其强调端侧处理的核心原因。生理情绪数据极其敏感,在本地处理、不上传云端,可以从架构上杜绝数据在传输和集中存储中的泄露风险。但任何生物信息采集都存在潜在风险,关键在于明确告知、授权与数据最小化原则。
Disclaimer: The above content is generated by AI and is for reference only.