AI出海 11小时前 更新于 2小时前 46

从视频理解到边缘部署,Om AI致力于现实世界的人工智能

Om AI Technology专注于边缘侧通用多模态视觉模型,通过小参数、本地部署实现高效、低成本的AI应用,强调真实场景中的多模态理解和实时推理能力,推动AI从云端向设备端部署转型。

70
热度
65
质量
60
影响力

深度分析

背景与问题

  • 大模型竞争正从参数规模转向实际部署能力,行业关注点移向现实世界应用。
  • Om AI Technology成立于2021年,选择专注于边缘侧通用多模态视觉模型,而非追求超大云模型,旨在将AI引入PC、摄像头、机器人等真实设备。
  • 团队基于长期媒体和视听行业经验,从真实问题出发构建模型,避免“拿着锤子找钉子”,确保技术解决实际需求。

核心内容

  • 技术重点:采用小、精、快的边缘模型策略,减少模型尺寸,实现本地设备运行,降低推理成本和数据上传需求,提升数据安全与隐私保护。
    • 关键方向是低参数模型下的视频理解,实现毫秒级推理速度,适用于安防、工业检测、AIoT分析等实时应用。
    • 强调真正的多模态能力是同时理解视频、音频和文本,而非简单识别图像和文本。
  • 产品展示:OttoBox AI Studio是AI原生内容创作产品,面向媒体专业人员和内容创作者。
    • 利用本地AI计算力,提供视频分析、资产匹配、脚本生成、快速视频制作等功能,定位为AI原生时代的内容创作伴侣,提升创意效率。
  • 应用领域:业务覆盖三大板块:
    • AI PC:与苹果、联想、惠普等厂商合作,完成旗舰产品部署,提供开箱即用体验。
    • AIoT:应用于机器人、机器狗、无人机等设备,赋予自主决策和行动能力。
    • 具身智能:探索普惠AI应用,如Homer App通过智能手机或AI眼镜帮助视障用户进行物体搜索和辅助导航。
  • 战略规划:今年重点推出下一代边缘多模态模型VLX,旨在进一步提升视频理解和决策能力,同时持续降低运营成本。

意义与影响

  • 推动AI行业从云端竞争转向设备端部署,使Om AI等公司成为现实世界多模态AI采用的关键驱动力。
  • 边缘部署优势显著:降低推理成本,解决企业对数据安全和隐私的担忧,尤其适用于大规模视频分析场景。
  • 通过行业驱动的方法,公司能快速部署模型并获取高质量现实数据,加速AI在媒体、工业、辅助技术等领域的实际应用。
  • 促进AI普及化,例如在辅助技术中提升视障用户的生活质量,体现技术的包容性和社会价值。

免责声明:以上内容由 AI 生成,仅供参考。