AI日报 | 2026年5月23日(周五)

AI资讯2小时前更新 程序员阿超
269 0 0

📰 AI 日报 | 2026年05月23日


1. Google I/O 2026:Gemini 3.5 Flash 发布,推理速度近 300 tokens/秒

Google 在 I/O 2026 上发布了专为 Agent 优化的 Gemini 3.5 Flash 模型。该模型推理速度达到近 300 tokens/秒,是上一代 3.1 Pro 模型的约 4 倍,但 benchmark 得分与后者持平。API 定价大幅下降:输入 $1.50/百万 tokens,输出 $9/百万 tokens(3.1 Pro 分别为 $2 和 $12,超过 200K tokens 后更高)。Google 声称大型企业客户若迁移至此模型,每年可节省约 10 亿美元 token 费用。同时发布的还有 Gemini Omni Flash——一款任意模态到任意模态的生成模型,支持视频+文本联合输入,已在 Flow 平台上线,替代此前的 Veo 3。

> 来源:[Ars Technica](https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/)


2. Google SynthID 水印技术被 OpenAI、Nvidia 等多家公司采用

Google 宣布其 SynthID AI 内容水印技术已被 OpenAI、Nvidia、Kakao 和 ElevenLabs 等公司采用。SynthID 通过在图像像素、视频帧和音频波形中嵌入不可见水印来标记 AI 生成内容。据 Google DeepMind 科学家 Pushmeet Kohli 透露,该技术经过专门加固,即使对内容进行压缩、裁剪或旋转,水印依然可被检测。截至目前,SynthID 已标记 1000 亿张图像和视频,以及相当于 6 万年的音频内容。OpenAI 将在 GPT 图像生成中使用 SynthID,Nvidia 则将其集成到 Cosmos 世界基础模型中。不过,SynthID 目前仅覆盖 Google 自有模型的产出,大量开源模型生成的 AI 内容仍无水印标记。

> 来源:[Ars Technica](https://arstechnica.com/google/2026/05/googles-synthid-ai-watermarking-tech-is-being-adopted-by-openai-nvidia-and-more/)


3. Figure AI 人形机器人连续 48 小时自主分拣包裹,直播引热议

机器人创业公司 Figure AI 对其 Figure 03 人形机器人进行了为期一周多的 24/7 直播展示。机器人任务为识别包裹条形码并将其面朝下放置在传送带上。机器人搭载 Helix 02 神经网络系统,AI 推理完全在设备端运行,训练数据包括 1000+ 小时人体运动数据和 20 万个并行模拟环境。每台机器人电池续航约 3-4 小时,可自主请求其他机器人接替。直播第 48 小时时,CEO Brett Adcock 宣称实现了”48 小时无故障自主运行”。此后团队还安排了机器人与人类实习生的 10 小时”人机对决”,人类在速度上占优,机器人则以持续性见长。

> 来源:[Ars Technica](https://arstechnica.com/ai/2026/05/the-internet-cant-stop-watching-figure-ais-humanoid-robots-handling-packages/)


4. Google 搜索全面 AI 化:AI Mode 月活用户突破 10 亿

Google 搜索 VP Liz Reid 在 I/O 2026 上宣布,AI Mode 月活跃用户已超过 10 亿,使用量每季度翻倍。Google 推出了”25 年来最大改版”的搜索框——支持 AI 驱动的动态扩展和意图预测。搜索将集成基于 Gemini 3.5 Flash 的 Agent 能力,可在搜索结果中生成交互式 UI(如滑块、按钮),甚至根据查询生成完整的小应用。AI Overviews 现覆盖大多数搜索,新增从 Overview 无缝跳转至 AI Mode 的功能。Google 还在 AI Mode 中集成了 Antigravity 作为 Agent 编排层,支持两种模式:单次生成的交互式 UI 和完整的自定义 App。

> 来源:[Ars Technica](https://arstechnica.com/google/2026/05/buckle-up-google-is-set-to-remake-search-with-agentic-ai-in-2026/)


5. Cohere 开源 2180 亿参数 Command A+ 模型,仅需 2 张 H100

Cohere 正式开源了其最新大语言模型 Command A+,采用 MoE(混合专家)架构,总参数 2180 亿、活跃参数仅 250 亿,支持 W4A4 量化,可在 2 张 NVIDIA H100 或单张 Blackwell GPU 上运行。相比前代 Command A Reasoning,τ²-Bench Telecom 得分从 37% 跃升至 85%,Terminal-Bench Hard 从 3% 提升至 25%。多模态方面 MMMU Pro 达到 63%、MMMU 75.1%。语言覆盖从 23 种扩展至 48 种。该模型还首次采用了 Cohere 的新一代 tokenizer,压缩率显著提升,结合推测解码(speculative decoding)实现更高推理速度。

> 来源:[Cohere Blog](https://cohere.com/blog/command-a-plus)

© 版权声明

相关文章

暂无评论

暂无评论...