谷歌I/O2026发布Gemini3.5Flash与Omni及Spark三款AI新品全面升级多模态能

2026年5月26日,谷歌公司在美国加利福尼亚州山景城 Shoreline Amphitheatre 举行的年度 Google I/O 开发者大会上,由谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在主题演讲中正式发布三款人工智能产品:Gemini 3.5 Flash、Gemini Omni 与 Gemini Spark。三款产品分别面向智能体开发者、多模态内容创作者及个人用户,覆盖从后端推理到前端交互的完整AI应用链条。上述信息来源于谷歌官方 I/O 大会直播页面及谷歌 AI 官方博客(blog.google/technology/ai)发布的技术说明文档。

一、Gemini 3.5 Flash:面向智能体场景的高速推理模型

Gemini 3.5 Flash 是 Gemini 3.5 系列中定位为轻量化高吞吐的推理模型。根据谷歌官方公布的技术指标,该模型推理速度达到 289 token/s,较上一代 Gemini 2.5 Flash 提升约40%。该模型在设计上针对智能体(Agent)工作流进行了专项优化,支持长上下文窗口与多步任务规划能力。谷歌在技术文档中指出,Gemini 3.5 Flash 适用于需要低延迟、高并发响应的自动化任务场景,包括客服对话系统、数据处理管道及代码辅助工具等。该模型已于 I/O 大会当日通过 Google AI Studio 和 Vertex AI 平台向开发者开放试用。

二、Gemini Omni:全能多模态模型支持文生视频

Gemini Omni 是谷歌此次发布的旗舰级多模态大模型,具备文本、图像、音频、视频四模态统一理解与生成能力。其中,文生视频(Text-to-Video)功能为本次发布的核心亮点。根据谷歌官方演示,用户输入文本描述后,Gemini Omni 可直接生成最高 1080p 分辨率、时长 30 秒的视频片段。该模型在 MMMU、MathVista 等多项多模态基准测试中的综合得分位居同期已发布模型前列。Gemini Omni 面向内容创作者与企业级用户,通过 Vertex AI 提供 API 接口,定价策略将根据调用量与分辨率分级计费,具体价格已在谷歌云官网公布。

三、Gemini Spark:全天候个人AI助手

Gemini Spark 是谷歌推出的面向普通消费者的个人AI助手产品,定位为全天候运行的日常辅助工具。该产品集成于谷歌现有生态系统,包括 Android 手机、Chrome 浏览器及 Google Assistant。Gemini Spark 强调低功耗与实时响应,支持语音唤醒与文字交互两种模式,可执行日程管理、信息检索、邮件摘要等日常任务。谷歌在发布会上表示,Gemini Spark 将首先在美国地区的 Pixel 系列设备与 Google One 订阅用户中推送,后续扩展至全球市场。

四、战略意义与行业影响

此次三款产品的同步发布,体现了谷歌将 AI 能力从单一大模型向分层化、场景化产品矩阵转型的明确战略。Gemini 3.5 Flash 瞄准开发者与企业后端需求,Gemini Omni 面向高价值内容生产场景,Gemini Spark 则覆盖大众消费市场,三者形成从技术底层到用户终端的完整闭环。根据谷歌官方披露,截至 2026 年第一季度,Gemini API 的月活跃开发者数量已超过 300 万。此次新品发布预计将进一步扩大其在 AI 基础设施市场的份额。