Google一口气发了多少东西?I/O 2026完整梳理

Favoritecollect
Shareshare

来源: AI寒武纪

距离上一届I/O又过了一年。

Google CEO在开场就定了基调:过去这一年,AI行业进入了新阶段,人们不再只关心技术本身,而是想看到AI真正为日常产品带来价值。Google的回答,是今天这场发布会。

图片

token数量:从480万亿到3千万亿

衡量AI采用规模,token是一个直观的指标。

两年前,Google旗下各产品每月处理的token总量是9.7万亿。去年I/O时,这个数字增长到约480万亿。今年,直接跳到每月超过3.2千万亿(quadrillion),增长了7倍。

图片

开发者和企业侧的数据同样亮眼:

每月使用Google模型构建应用的开发者超过850万

模型API目前每分钟处理约190亿token

过去12个月,超过375家Google Cloud客户各自处理了超过1万亿token

产品规模:13款产品用户破十亿

Google目前有13款产品月活用户超过10亿,其中5款超过30亿。

Search依然是覆盖范围最广的AI产品入口。AI Overviews月活已超过25亿。AI Mode作为Search有史以来最大的升级,上线仅一年月活就突破10亿,人们对它的使用方式也在变化,从单条查询逐渐演变成持续对话。

Gemini app去年I/O时月活4亿,今年已超过9亿,翻了一倍多,日请求量增长超过7倍。其中Nano Banana图像生成模型已累计生成超过500亿张图片。

对话式AI进入更多产品

Ask YouTube

YouTube上有大量视频,但找到真正相关的内容并不容易。Ask YouTube重新设计了这一体验,不只是展示匹配的视频,还会直接跳到视频中最相关的片段。目前正在开始测试,今年夏天将在美国全面推出。

Docs Live

Google Docs新增语音功能Docs Live。以前用Gemini写文档需要输入明确的指令,现在只要对着麦克风把想法说出来,Gemini会自动整理成文档。未来还将支持直接用声音新建和编辑文档。Docs Live今年夏天向订阅用户推出,同期Gmail和Keep也将加入语音功能。

Ask Maps

Maps迎来十年来最大升级,其中包括Ask Maps功能,支持更复杂、更长的问题。

基础设施:资本支出从310亿到1800亿美元

支撑这些产品规模运转,需要大规模基础设施投入。

2022年,Google每年的资本支出是310亿美元。今年预计达到约1800亿至1900亿美元,大约是当年的6倍。

芯片层面,Google在Cloud Next上发布了第八代TPU,首次采用双芯片策略,训练和推理各有专属架构:

TPU 8t 用于大规模预训练,原始算力约为上一代的3倍。结合JAX和Pathways,训练不再受限于单个数据中心,可以跨多个站点分布式训练,全球可调用超过100万块TPU,构成全球最大训练集群。模型训练时间从数月缩短到数周。

TPU 8i 专为推理设计,在速度上做了全面优化。两款芯片的能效均比上一代提升约2倍。

图片

新模型:Gemini Omni与Gemini 3.5 Flash

Gemini Omni

图片

AI正在从预测文字转向模拟现实。Gemini Omni是Google新发布的多模态世界模型,可以接受任意模态的输入,生成任意模态的输出。首发版本以视频输出为主,后续会支持图像和文字。Gemini Omni Flash今天起可以在Gemini app、Google Flow和YouTube Shorts上体验,开发者和企业客户也将在未来几周通过API获得访问权限。

图片

1)用自然语言编辑视频

Omni支持通过对话逐步编辑视频,每一条指令都建立在上一条的基础上,角色保持一致,物理规律成立,场景前后连贯。

2)物理理解与世界知识

Omni对重力、动能、流体动力学等物理规律有更准确的直觉理解,生成的场景物理表现更真实。同时,它还能调用Gemini的历史、科学和文化背景知识,把语言、图像和含义连接起来,而不只是模式匹配。

3)任意输入组合

Omni支持把图片、文字、视频、音频同时作为参考输入,生成统一风格的输出。

4)数字Avatar

用户可以用Omni创建自己的数字Avatar,生成看起来和听起来都像自己的视频。在修改视频中的音频和语音方面,Google表示还在测试

不过有网友初步测试发现,omini的视频生成很拉胯,和seedance2.0差的比较远

Gemini 3.5 Flash

Google今天推出Gemini 3.5 Flash,定位为将前沿智能与行动能力相结合的新一代模型。

与3.1 Pro相比,3.5 Flash在多项基准测试上领先,具体包括:Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%),在多模态理解上CharXiv Reasoning达到84.2%。其中GDPVal专门衡量现实世界中具有经济价值的任务,进步尤为明显。速度方面,输出token每秒是其他前沿模型的4倍

图片

3.5 Flash配合Antigravity可以调度多个子Agent协同工作,处理规模化的复杂任务

前端生成能力依旧非常能打,在多模态基础上,3.5 Flash还能生成更丰富的交互式网页UI和图形,比如直接在AI Studio中为一篇研究论文生成交互式动画。

价格方面,3.5 Flash的成本不到同等前沿模型的一半。Google给出了一个估算:头部企业每天处理约1万亿token,如果将80%的工作负载从其他前沿模型切换到3.5 Flash,每年可以节省超过10亿美元。

Gemini 3.5 Flash今天起对所有用户和API开放。Gemini 3.5 Pro目前在Google内部使用,下个月推出。

Google内部数据显示,借助Antigravity平台和3.5 Flash,AI开发工具的token处理量从3月份的每天5000亿,已经翻倍增长至如今每天超过3万亿。

Antigravity 2.0:Agent开发平台

Antigravity原本是一个AI编程环境,现在正在扩展为一个完整的自主AI Agent开发和管理平台。

Antigravity 2.0是一个新的独立桌面应用,作为Agent交互的中心,用户可以在其中协调各类Agent处理不同任务。在速度上,这个版本使用了专门优化的Flash版本,比其他前沿模型快12倍。Antigravity 2.0 和 Codex 长的简直一模一样,?

Antigravity用户今天起可以开始体验。详细内容见官方介绍:

https://deepmind.google/technologies/antigravity/

Gemini Spark:24小时运行的个人AI Agent

Gemini app即将推出个人AI Agent——Gemini Spark,在用户授权下代替用户在数字世界中采取行动。

几个关键特点:

  • • 运行在Google Cloud专用虚拟机上,7×24小时持续运行,不需要保持电脑开着

  • • 由Gemini 3.5和Antigravity驱动,可以在后台轻松处理长周期任务

  • • 从Google自有工具开始整合,未来几周通过MCP接入第三方工具

  • • 支持在Gemini app中交互,未来也可以通过邮件和即时通讯使用

  • • 在Android上,可以通过新UI空间Android Halo查看Agent的实时进度,今年晚些时候上线

  • • 今年夏天晚些时候,Spark将直接在Chrome中运行,成为跨网页的Agent浏览器

本周起Spark向受信测试用户开放,下周Beta版向美国Google AI Ultra订阅用户推出。

Search进入Agent时代

Search也在向Agent方向进化。

信息Agent :用户可以设置个性化AI Agent在后台持续运行,在合适的时机主动找到所需信息并协助采取行动。今年夏天起向Google AI Pro和Ultra订阅用户推出。

生成式UI :结合Gemini 3.5 Flash和Antigravity,Search将为每个问题动态生成定制化界面,包括个性化布局和交互式视觉内容。今年夏天向所有用户免费开放。

持久化自定义看板 :对于需要持续追踪的长期任务,Search可以为用户构建专属看板或追踪工具,类似为特定任务定制的迷你应用。未来几个月起向美国Google AI Pro和Ultra订阅用户开放。

其他发布内容

Daily Brief :Gemini app即将推出的开箱即用Agent,整合收件箱、日历和任务,生成个性化的每日摘要,不只是汇总信息,还会做优先级排序、整理和下一步建议,以便于快速浏览的形式呈现。

Google Flow :今天向所有用户推出新Agent,可以在用户参与和控制下规划并处理复杂任务。支持在Flow中直接vibe code各类创意工具,例如视频特效设计、手绘动画或文字叠加工具。

Google Pics :基于最新Nano Banana模型的AI图像创建和编辑工具。它将图片中每个元素视为独立对象而非平面图像,支持对特定细节进行精确创建、替换和调整。目前向受信测试用户开放,今年夏天晚些时候向Workspace中的Google AI Pro和Ultra订阅用户推出。

智能眼镜 :去年初次亮相的AI眼镜产品有了更多细节,分为音频眼镜(耳机形态,语音提示)和显示眼镜(可显示信息)两种,均支持免提使用Gemini。音频眼镜今年秋天率先上市。

Gemini for Science :面向科学研究的AI工具集,整合了Gemini的深度推理和研究能力、Deep Think和Deep Research,并新增了可以将Antigravity等Agent平台连接到超过30个主要生命科学数据库和工具的Science Skills。用户可以在Google Labs申请试用Gemini for Science实验功能,Science Skills今天起在Github和Antigravity中直接可用。

图片

从TPU 8i到Gemini 3.5,再到Antigravity和Spark,Google在这届I/O上所呈现的,是一套从芯片到应用全面朝Agent方向演进的完整体系。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup