
AI 日报 | 2026年6月4日(周四):Alphabet $850亿融资支持Google AI、Gemma 4 12B发布
━━━ 头条 ━━━
Alphabet 创纪录募集 $850 亿,全力押注 Google AI — Alphabet 完成了史上最大规模融资——$850 亿,全部用于支持 Google 的 AI 业务扩张。这笔资金将主要用于 AI 基础设施(数据中心、TPU 集群)、Gemini 模型训练和 AI 产品线。分析师认为这是 AI 军备竞赛进入新阶段的标志性事件,预示未来几年大模型算力投入将进一步激增。来源:TechCrunch
Google DeepMind 发布 Gemma 4 12B:16GB 笔记本即可运行的多模态模型 — Google DeepMind 推出 Gemma 4 12B 模型,这是首个可在 16GB RAM 笔记本上本地运行的 encoder-free 多模态模型。支持原生音频输入处理,无需外部编码器。这标志着端侧 AI 能力的一次重大跃升——开发者可以在普通消费级硬件上运行多模态 AI 应用。来源:Ars Technica | 来源:The Decoder | 来源:MarkTechPost
━━━ 行业动态 ━━━
• OpenAI 发布全新 Codex 工具,瞄准白领工作自动化 — OpenAI 发布了面向白领工作的 Codex 工具套件,将代码生成能力延伸到办公自动化场景。该工具可自动执行数据分析、报告撰写、流程编排等知识工作,标志着 AI 从辅助编程向全场景办公助手演进。来源:TechCrunch
• Anthropic 将 Claude Mythos 部署至 15+ 国关键基础设施 — Anthropic 的 Claude Mythos(安全关键型模型)已扩展至 15 个以上国家的关键基础设施系统,涵盖能源、金融、医疗等领域。这是目前最大规模的大模型关键基础设施部署案例。来源:TechCrunch
• Meta 的 WhatsApp Business AI Agent 全球上线 — Meta 为 WhatsApp Business 推出的 AI Agent 现已向全球用户开放。企业可以通过对话式 AI 自动处理客户咨询、订单管理和售后支持。来源:TechCrunch
• Microsoft 推出 Scout 个人助理与 Project Solara Agent 操作系统 — Microsoft 在 Build 2026 后接连推出两款重磅产品:Scout 是一款受 OpenClaw 启发的个人 AI 助手;Project Solara 则是一个专为 AI Agent 设计的 Android 操作系统,彻底以 Agent 为中心而非传统 App。来源:TechCrunch | 来源:Ars Technica
• Google Dreambeans:将你的生活变成卡通 — Google 推出 Dreambeans,一个名字最奇怪的 AI 工具,能够将用户的真实生活照片和视频转换为卡通风格内容。来源:TechCrunch
• Google 为 Android 推出防 AI 深度伪造通话检测 — Google 宣布为 Android 系统推出深度伪造通话检测功能,可自动识别和警告由 AI 生成的冒充诈骗电话。同时新版 Android 支持将设备用作 AirDrop 接收器。来源:TechCrunch | 来源:Ars Technica
• Coralogix 获 2 亿美元融资,打造 AI Agent 监控层 — AI 可观测性平台 Coralogix 完成 2 亿美元新一轮融资,押注 AI Agent 的监控和可观测性需求。随着企业部署越来越多的 AI Agent,监控 Agent 行为和性能正成为一个快速增长的新市场。来源:TechCrunch
━━━ 🤖 模型 & 研究 ━━━
• xAI 更新 Grok Imagine 至 1.5,新增图生视频 — xAI 升级 Grok Imagine 到 1.5 版本,新增 image-to-video 生成功能,支持 720p 分辨率输出。用户可以将静态图片转换为动态视频片段。来源:The Decoder
• Ideogram 4.0 开源:原生 2K 分辨率,文字渲染大幅提升 — Ideogram 4.0 以开源权重发布,支持原生 2K 分辨率输出,文字渲染能力显著改善。这是目前开源文生图模型中分辨率最高、文字最清晰的方案之一。来源:The Decoder
• Miso Labs 开源 8B 参数情感语音模型 MisoTTS — Miso Labs 发布 MisoTTS,一个 80 亿参数的情感语音合成模型,采用开放权重发布,能够生成高度自然且富有情感表现力的语音。来源:MarkTechPost
• OpenJarvis:本地优先的个人 AI Agent 框架 — 一个名为 OpenJarvis 的开源框架发布,支持在本地设备上运行个人 AI Agent,配备工具调用、记忆管理和持续学习能力。来源:MarkTechPost
• 李飞飞亲自下场定义「世界模型」 — 斯坦福教授、AI 领域传奇人物李飞飞发表论文,亲自为”世界模型”(World Model)下定义。这是继 LeCun 押注世界模型方向后,又一位 AI 泰斗级人物正式参与构建世界模型的理论框架。来源:量子位
• LeCun 10 亿押注的世界模型方向,中国视觉大模型团队早已布局 — 量子位报道,LeCun 力推的视觉世界模型(V-JEPA)方向,全球领先的视觉大模型团队早已布局。世界模型正从理论走向大规模工程实践。来源:量子位
• 杰夫·贝佐斯资助大脑「核心算法」研究 — Wired 报道,Jeff Bezos 正在资助一项探索大脑核心算法的雄心勃勃的研究项目,试图破解大脑的底层计算原理。来源:Wired
━━━ 🇨🇳 中国 AI 动态 ━━━
• 字节 AI 2026 四大关键命题与火山引擎 MaaS 营收目标 150 亿 — 36氪独家披露字节 AI 2026 年的四个关键战略方向。同时火山引擎将 MaaS 营收目标提升至全年 150 亿元,旗下 Seedance 2.0 单月营收已超 10 亿元,显示出字节在 AI 云服务和内容生成领域的强劲增长。来源:36氪 | 来源:36氪
• 扣子 3.0 实测:手机远程遥控电脑 Agent — 字节跳动发布扣子(Coze)3.0,支持通过手机远程操控电脑上的 AI Agent。用户可以在移动端发起指令,Agent 在 PC 端完成复杂的自动化任务——文件处理、数据爬取、软件操作等。来源:量子位
• 戴盟机器人完成亿元融资,阿里通义多模态大牛加盟 — 戴盟机器人完成亿元级融资,原阿里通义千问多模态团队技术负责人加盟,将攻关物理世界模型。LeCun 力推的「世界模型」路线在中国的具身智能领域加速落地。来源:量子位
• 华为系帧跃科技完成千万美金天使轮 — 帧跃科技完成千万美金级天使轮融资,由华为系团队创办,即将发布 AI 视频生成产品 Leadde。来源:雷锋网
• 深圳具身智能公司获汇川、中国电信亿元融资 — 深圳一家具身智能机器人公司完成亿元级融资,其”视触觉”传感器出货量位居行业第一,投资方包括汇川技术和中国电信。来源:36氪
• A 股账户可以买 Robotaxi 了 — 小马智行、文远知行等 Robotaxi 公司登陆 A 股,普通投资者可通过证券账户直接参与自动驾驶出行公司的投资。来源:量子位
• 比亚迪与中国石化深化战略合作,共建智慧能源生态 — 比亚迪与中国石化签署深化战略合作协议,双方将在智慧能源、充电网络等领域展开深度合作。来源:量子位
• 面壁智能「开源周」:定义端侧 AI 终局 — 面壁智能开启”开源周”活动,发布一系列端侧 AI 模型和工具,系统性布局端侧 AI 生态。来源:雷锋网
━━━ AI 安全 & 政策 ━━━
• Google 被英监管机构要求让 AI 搜索链接更清晰 — 英国监管机构裁定 Google 必须在 AI Overviews 搜索结果中提供更清晰的来源链接,并允许英国出版商选择退出 AI 搜索索引。来源:Ars Technica
• 特朗普签署 AI 监管行政令,但安全团队已被削弱 — 特朗普签署了一项范围收窄的 AI 监管行政令,要求对前沿 AI 模型进行安全测试。但批评者指出政府内部的 AI 安全测试团队此前已被 DOGE 大幅裁减,实际执行能力受限。来源:Ars Technica
• 法院面临 AI 生成诉讼案件激增的挑战 — MIT Technology Review 报道,美国各级法院正在努力应对 AI 生成的法律文书和诉讼案件激增带来的挑战。部分案件中出现了由 AI 生成的有漏洞或完全虚构的法律引用。来源:MIT Tech Review
• Uber 限制员工使用 Claude Code 等 AI 工具预算 — Uber 在短短 4 个月内用完了年度 AI 工具预算,不得不对员工使用 Claude Code 等 AI 编码助手的支出设置上限。这一事件反映了企业对 AI 成本管理的关注正在上升。来源:TechCrunch