AI日报 | 2026年5月23日（周六）：Gemini 3.5 Flash 近 300 tokens/秒、Figure 机器人自主分拣

📰 AI 日报 | 2026年05月23日

1. Google I/O 2026：Gemini 3.5 Flash 发布，推理速度近 300 tokens/秒

Google 在 I/O 2026 上发布了专为 Agent 优化的 Gemini 3.5 Flash 模型。该模型推理速度达到近 300 tokens/秒，是上一代 3.1 Pro 模型的约 4 倍，但 benchmark 得分与后者持平。API 定价大幅下降：输入 $1.50/百万 tokens，输出 $9/百万 tokens（3.1 Pro 分别为 $2 和 $12，超过 200K tokens 后更高）。Google 声称大型企业客户若迁移至此模型，每年可节省约 10 亿美元 token 费用。同时发布的还有 Gemini Omni Flash——一款任意模态到任意模态的生成模型，支持视频+文本联合输入，已在 Flow 平台上线，替代此前的 Veo 3。

> 来源：[Ars Technica](https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/)

2. Google SynthID 水印技术被 OpenAI、Nvidia 等多家公司采用

Google 宣布其 SynthID AI 内容水印技术已被 OpenAI、Nvidia、Kakao 和 ElevenLabs 等公司采用。SynthID 通过在图像像素、视频帧和音频波形中嵌入不可见水印来标记 AI 生成内容。据 Google DeepMind 科学家 Pushmeet Kohli 透露，该技术经过专门加固，即使对内容进行压缩、裁剪或旋转，水印依然可被检测。截至目前，SynthID 已标记 1000 亿张图像和视频，以及相当于 6 万年的音频内容。OpenAI 将在 GPT 图像生成中使用 SynthID，Nvidia 则将其集成到 Cosmos 世界基础模型中。不过，SynthID 目前仅覆盖 Google 自有模型的产出，大量开源模型生成的 AI 内容仍无水印标记。

> 来源：[Ars Technica](https://arstechnica.com/google/2026/05/googles-synthid-ai-watermarking-tech-is-being-adopted-by-openai-nvidia-and-more/)

3. Figure AI 人形机器人连续 48 小时自主分拣包裹，直播引热议

机器人创业公司 Figure AI 对其 Figure 03 人形机器人进行了为期一周多的 24/7 直播展示。机器人任务为识别包裹条形码并将其面朝下放置在传送带上。机器人搭载 Helix 02 神经网络系统，AI 推理完全在设备端运行，训练数据包括 1000+ 小时人体运动数据和 20 万个并行模拟环境。每台机器人电池续航约 3-4 小时，可自主请求其他机器人接替。直播第 48 小时时，CEO Brett Adcock 宣称实现了”48 小时无故障自主运行”。此后团队还安排了机器人与人类实习生的 10 小时”人机对决”，人类在速度上占优，机器人则以持续性见长。

> 来源：[Ars Technica](https://arstechnica.com/ai/2026/05/the-internet-cant-stop-watching-figure-ais-humanoid-robots-handling-packages/)

4. Google 搜索全面 AI 化：AI Mode 月活用户突破 10 亿

Google 搜索 VP Liz Reid 在 I/O 2026 上宣布，AI Mode 月活跃用户已超过 10 亿，使用量每季度翻倍。Google 推出了”25 年来最大改版”的搜索框——支持 AI 驱动的动态扩展和意图预测。搜索将集成基于 Gemini 3.5 Flash 的 Agent 能力，可在搜索结果中生成交互式 UI（如滑块、按钮），甚至根据查询生成完整的小应用。AI Overviews 现覆盖大多数搜索，新增从 Overview 无缝跳转至 AI Mode 的功能。Google 还在 AI Mode 中集成了 Antigravity 作为 Agent 编排层，支持两种模式：单次生成的交互式 UI 和完整的自定义 App。

> 来源：[Ars Technica](https://arstechnica.com/google/2026/05/buckle-up-google-is-set-to-remake-search-with-agentic-ai-in-2026/)

5. Cohere 开源 2180 亿参数 Command A+ 模型，仅需 2 张 H100

Cohere 正式开源了其最新大语言模型 Command A+，采用 MoE（混合专家）架构，总参数 2180 亿、活跃参数仅 250 亿，支持 W4A4 量化，可在 2 张 NVIDIA H100 或单张 Blackwell GPU 上运行。相比前代 Command A Reasoning，τ²-Bench Telecom 得分从 37% 跃升至 85%，Terminal-Bench Hard 从 3% 提升至 25%。多模态方面 MMMU Pro 达到 63%、MMMU 75.1%。语言覆盖从 23 种扩展至 48 种。该模型还首次采用了 Cohere 的新一代 tokenizer，压缩率显著提升，结合推测解码（speculative decoding）实现更高推理速度。

> 来源：[Cohere Blog](https://cohere.com/blog/command-a-plus)

# AI日报 # AI资讯 # AI新闻 # AI日报 # 行业动态

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...