AI 日报 | 2026年6月4日（周四）：Alphabet $850亿融资支持Google AI、Gemma 4 12B发布

AI 日报 | 2026年6月4日（周四）：Alphabet 0亿融资支持Google AI、Gemma 4 12B发布

AI 日报 | 2026年6月4日（周四）：Alphabet $850亿融资支持Google AI、Gemma 4 12B发布

━━━ 头条 ━━━

Alphabet 创纪录募集 $850 亿，全力押注 Google AI — Alphabet 完成了史上最大规模融资——$850 亿，全部用于支持 Google 的 AI 业务扩张。这笔资金将主要用于 AI 基础设施（数据中心、TPU 集群）、Gemini 模型训练和 AI 产品线。分析师认为这是 AI 军备竞赛进入新阶段的标志性事件，预示未来几年大模型算力投入将进一步激增。来源：TechCrunch

Google DeepMind 发布 Gemma 4 12B：16GB 笔记本即可运行的多模态模型 — Google DeepMind 推出 Gemma 4 12B 模型，这是首个可在 16GB RAM 笔记本上本地运行的 encoder-free 多模态模型。支持原生音频输入处理，无需外部编码器。这标志着端侧 AI 能力的一次重大跃升——开发者可以在普通消费级硬件上运行多模态 AI 应用。来源：Ars Technica | 来源：The Decoder | 来源：MarkTechPost

━━━ 行业动态 ━━━

• OpenAI 发布全新 Codex 工具，瞄准白领工作自动化 — OpenAI 发布了面向白领工作的 Codex 工具套件，将代码生成能力延伸到办公自动化场景。该工具可自动执行数据分析、报告撰写、流程编排等知识工作，标志着 AI 从辅助编程向全场景办公助手演进。来源：TechCrunch

• Anthropic 将 Claude Mythos 部署至 15+ 国关键基础设施 — Anthropic 的 Claude Mythos（安全关键型模型）已扩展至 15 个以上国家的关键基础设施系统，涵盖能源、金融、医疗等领域。这是目前最大规模的大模型关键基础设施部署案例。来源：TechCrunch

• Meta 的 WhatsApp Business AI Agent 全球上线 — Meta 为 WhatsApp Business 推出的 AI Agent 现已向全球用户开放。企业可以通过对话式 AI 自动处理客户咨询、订单管理和售后支持。来源：TechCrunch

• Microsoft 推出 Scout 个人助理与 Project Solara Agent 操作系统 — Microsoft 在 Build 2026 后接连推出两款重磅产品：Scout 是一款受 OpenClaw 启发的个人 AI 助手；Project Solara 则是一个专为 AI Agent 设计的 Android 操作系统，彻底以 Agent 为中心而非传统 App。来源：TechCrunch | 来源：Ars Technica

• Google Dreambeans：将你的生活变成卡通 — Google 推出 Dreambeans，一个名字最奇怪的 AI 工具，能够将用户的真实生活照片和视频转换为卡通风格内容。来源：TechCrunch

• Google 为 Android 推出防 AI 深度伪造通话检测 — Google 宣布为 Android 系统推出深度伪造通话检测功能，可自动识别和警告由 AI 生成的冒充诈骗电话。同时新版 Android 支持将设备用作 AirDrop 接收器。来源：TechCrunch | 来源：Ars Technica

• Coralogix 获 2 亿美元融资，打造 AI Agent 监控层 — AI 可观测性平台 Coralogix 完成 2 亿美元新一轮融资，押注 AI Agent 的监控和可观测性需求。随着企业部署越来越多的 AI Agent，监控 Agent 行为和性能正成为一个快速增长的新市场。来源：TechCrunch

━━━ 🤖 模型 & 研究 ━━━

• xAI 更新 Grok Imagine 至 1.5，新增图生视频 — xAI 升级 Grok Imagine 到 1.5 版本，新增 image-to-video 生成功能，支持 720p 分辨率输出。用户可以将静态图片转换为动态视频片段。来源：The Decoder

• Ideogram 4.0 开源：原生 2K 分辨率，文字渲染大幅提升 — Ideogram 4.0 以开源权重发布，支持原生 2K 分辨率输出，文字渲染能力显著改善。这是目前开源文生图模型中分辨率最高、文字最清晰的方案之一。来源：The Decoder

• Miso Labs 开源 8B 参数情感语音模型 MisoTTS — Miso Labs 发布 MisoTTS，一个 80 亿参数的情感语音合成模型，采用开放权重发布，能够生成高度自然且富有情感表现力的语音。来源：MarkTechPost

• OpenJarvis：本地优先的个人 AI Agent 框架 — 一个名为 OpenJarvis 的开源框架发布，支持在本地设备上运行个人 AI Agent，配备工具调用、记忆管理和持续学习能力。来源：MarkTechPost

• 李飞飞亲自下场定义「世界模型」 — 斯坦福教授、AI 领域传奇人物李飞飞发表论文，亲自为”世界模型”（World Model）下定义。这是继 LeCun 押注世界模型方向后，又一位 AI 泰斗级人物正式参与构建世界模型的理论框架。来源：量子位

• LeCun 10 亿押注的世界模型方向，中国视觉大模型团队早已布局 — 量子位报道，LeCun 力推的视觉世界模型（V-JEPA）方向，全球领先的视觉大模型团队早已布局。世界模型正从理论走向大规模工程实践。来源：量子位

• 杰夫·贝佐斯资助大脑「核心算法」研究 — Wired 报道，Jeff Bezos 正在资助一项探索大脑核心算法的雄心勃勃的研究项目，试图破解大脑的底层计算原理。来源：Wired

━━━ 🇨🇳 中国 AI 动态 ━━━

• 字节 AI 2026 四大关键命题与火山引擎 MaaS 营收目标 150 亿 — 36氪独家披露字节 AI 2026 年的四个关键战略方向。同时火山引擎将 MaaS 营收目标提升至全年 150 亿元，旗下 Seedance 2.0 单月营收已超 10 亿元，显示出字节在 AI 云服务和内容生成领域的强劲增长。来源：36氪 | 来源：36氪

• 扣子 3.0 实测：手机远程遥控电脑 Agent — 字节跳动发布扣子（Coze）3.0，支持通过手机远程操控电脑上的 AI Agent。用户可以在移动端发起指令，Agent 在 PC 端完成复杂的自动化任务——文件处理、数据爬取、软件操作等。来源：量子位

• 戴盟机器人完成亿元融资，阿里通义多模态大牛加盟 — 戴盟机器人完成亿元级融资，原阿里通义千问多模态团队技术负责人加盟，将攻关物理世界模型。LeCun 力推的「世界模型」路线在中国的具身智能领域加速落地。来源：量子位

• 华为系帧跃科技完成千万美金天使轮 — 帧跃科技完成千万美金级天使轮融资，由华为系团队创办，即将发布 AI 视频生成产品 Leadde。来源：雷锋网

• 深圳具身智能公司获汇川、中国电信亿元融资 — 深圳一家具身智能机器人公司完成亿元级融资，其”视触觉”传感器出货量位居行业第一，投资方包括汇川技术和中国电信。来源：36氪

• A 股账户可以买 Robotaxi 了 — 小马智行、文远知行等 Robotaxi 公司登陆 A 股，普通投资者可通过证券账户直接参与自动驾驶出行公司的投资。来源：量子位

• 比亚迪与中国石化深化战略合作，共建智慧能源生态 — 比亚迪与中国石化签署深化战略合作协议，双方将在智慧能源、充电网络等领域展开深度合作。来源：量子位

• 面壁智能「开源周」：定义端侧 AI 终局 — 面壁智能开启”开源周”活动，发布一系列端侧 AI 模型和工具，系统性布局端侧 AI 生态。来源：雷锋网

━━━ AI 安全 & 政策 ━━━

• Google 被英监管机构要求让 AI 搜索链接更清晰 — 英国监管机构裁定 Google 必须在 AI Overviews 搜索结果中提供更清晰的来源链接，并允许英国出版商选择退出 AI 搜索索引。来源：Ars Technica

• 特朗普签署 AI 监管行政令，但安全团队已被削弱 — 特朗普签署了一项范围收窄的 AI 监管行政令，要求对前沿 AI 模型进行安全测试。但批评者指出政府内部的 AI 安全测试团队此前已被 DOGE 大幅裁减，实际执行能力受限。来源：Ars Technica

• 法院面临 AI 生成诉讼案件激增的挑战 — MIT Technology Review 报道，美国各级法院正在努力应对 AI 生成的法律文书和诉讼案件激增带来的挑战。部分案件中出现了由 AI 生成的有漏洞或完全虚构的法律引用。来源：MIT Tech Review

• Uber 限制员工使用 Claude Code 等 AI 工具预算 — Uber 在短短 4 个月内用完了年度 AI 工具预算，不得不对员工使用 Claude Code 等 AI 编码助手的支出设置上限。这一事件反映了企业对 AI 成本管理的关注正在上升。来源：TechCrunch

封面图：AI 日报 2026-06-04 封面

文章版权归作者所有，未经允许请勿转载。

AI 日报 | 2026年6月3日（周三）：Nvidia Nemotron 3 Ultra成美最强开源模型、豆包6月下旬正式收费

程序员阿超

14K

OpenAI 将 GPT-5.5 升级为 ChatGPT 默认模型

程序员阿超

10K

AI日报 | 2026年5月25日（周一）：Claude Mythos 发现上万高危漏洞、Gemini 3.5 Flash 发布

程序员阿超

9.5K

AI日报 | 2026年5月27日（周三）：月之暗面融资 20 亿美元、ING 用 Vibe Coding 构建系统

程序员阿超

9.1K

AI日报 | 2026年5月23日（周六）：Gemini 3.5 Flash 近 300 tokens/秒、Figure 机器人自主分拣

程序员阿超

8.8K

AI日报·晚间 | 2026年5月26日（周二）：MiniCPM5-1B 发布、ForgeTrain 开源

程序员阿超

9.1K

暂无评论

暂无评论...

AI 日报 | 2026年6月4日（周四）：Alphabet $850亿融资支持Google AI、Gemma 4 12B发布

AI 日报 | 2026年6月4日（周四）：Alphabet $850亿融资支持Google AI、Gemma 4 12B发布

━━━ 头条 ━━━

━━━ 行业动态 ━━━

━━━ 🤖 模型 & 研究 ━━━

━━━ 🇨🇳 中国 AI 动态 ━━━

━━━ AI 安全 & 政策 ━━━

AI 日报 | 2026年6月3日（周三）：Nvidia Nemotron 3 Ultra成美最强开源模型、豆包6月下旬正式收费

AI 日报 | 2026年6月5日（周五）：Anthropic称Claude编写超90%代码、阶跃Step 3.7 Flash登顶AA榜

相关文章

暂无评论

相关文章