Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆
谷歌I/O大会发布**Gemini 3.5 Flash**与**Gemini Omni**等新品,核心是推动以**智能体**为中心的AI应用。数据显示,谷歌AI的token处理量与用户规模呈爆发式增长。新模型在性能、速度和成本上优势显著,旨在重塑编程、视频生成等领域,并意图通过AI agent的深度
85
热度
90
质量
88
影响力
深度分析
一、 背景与战略:从数据爆发到智能体时代
本次谷歌I/O大会的召开,建立在一系列惊人的用户与使用数据增长之上。这揭示了AI技术普及的深度与速度。
- 数据飙升:谷歌每月处理的token数量从一年前的480万亿跃升至3.2千万亿,增幅达7倍。同时,其旗舰AI应用Gemini的月活用户从4亿增至9亿。这标志着AI正从技术探索进入大规模应用阶段。
- 战略聚焦:谷歌CEO Sundar Pichai指出“还有大量潜在的生产力等待被释放”。因此,本次发布会的核心主题是“智能体”。谷歌几乎将所有重磅新品都围绕智能体进行迭代,意在推动AI从被动回答的“工具”转变为主动执行的“助理”或“专家”,深度融入用户的工作流。
- 直面竞争:过去在AI编程领域(如面对Cursor、GitHub Copilot等)表现安静的谷歌,此次通过Gemini 3.5系列给出了强势回应,意图夺回开发者的注意力,弥补短板。
二、 核心产品解析:效能与成本的革命
1. Gemini 3.5 Flash:面向开发者与企业的“生产力引擎”
这是本次发布的最受关注的模型,被定义为“迄今为止最强大的智能体和编码模型”。其突破体现在三个维度:
- 性能与速度:在多项智能体和编码基准测试中超越前代旗舰Gemini 3.1 Pro,运行速度比其他前沿模型快4倍。这意味着开发、测试和部署AI应用的效率将得到质的提升。
- 成本效益:Pichai强调,该模型以不到竞争对手一半的成本提供前沿级能力。他举了一个具体例子:顶尖公司将80%的工作负载切换到3.5 Flash,每年可节省超10亿美元。这直接击中企业级用户的核心痛点——在AI规模应用时代,成本控制与性能同等重要。
- 内部变革:谷歌自身已成为该模型的最佳试验场。通过内部开发平台Antigravity与3.5 Flash结合,其内部每日处理的token量从3月的5000亿激增至3万亿,形成了“模型改进-应用扩大-数据反馈”的增强循环。
2. Gemini Omni:通往“世界模型”的多模态尝试
谷歌发布了能“从任意输入生成任意输出”的Gemini Omni模型,标志着其AI理念从“理解与生成文本”向“理解与模拟现实世界”跃进。
- 能力突破:它将Gemini的智能与生成式媒体模型结合,能根据图片、音频、视频和文本的组合输入,生成基于“真实世界知识”的高质量视频,并能通过对话进行编辑。
- 愿景与落地:Pichai将之描述为“人工智能从预测文本转向模拟现实”。该技术首先服务于视频创作,初期已在Gemini应用、Google Flow和YouTube Shorts上线,将大幅降低视频制作与编辑的技术门槛。
三、 深层含义与未来展望
- 生态竞争进入新阶段:谷歌不再仅仅提供单个模型API,而是通过智能体架构,将AI能力深度嵌入其整个产品生态(搜索、办公、开发平台、YouTube等),构建从底层模型到上层应用的全栈式、高粘性护城河。
- 商业逻辑的转变:通过强调**Flash模型的
免责声明:以上内容由 AI 生成,仅供参考。