📰 AI 日报 | 2026-05-27 (周三)
━━━ 头条 ━━━
月之暗面完成约20亿美元新融资,估值突破200亿美元
Kimi 母公司月之暗面于5月初完成新一轮约20亿美元融资,投后估值突破200亿美元,这是国内大模型创业公司迄今金额最大的单笔融资之一,标志着大模型领域”马太效应”持续强化。来源:36氪
━━━ 行业动态 ━━━
- ING 银行用 “Vibe Coding” AI 构建交易系统 — 荷兰国际集团 ING 正在使用 AI 驱动的 “Vibe Coding” 方式自主构建其新一代交易系统。Bloomberg 报道了这一传统金融巨头拥抱 AI 原生开发的里程碑事件。*来源:Bloomberg*
- Block 开源 AI Agent Goose,公司 60% 员工每周使用 — Square 的母公司 Block 正式开源了内部 AI Agent「Goose」,目前已获 44K+ GitHub Stars,约 60% 的员工(跨工程、销售、设计、产品等 15 个岗位)每周使用。其核心创新是 YAML 格式的「Recipe」文件,让非工程师也能编写 Agent 工作流。项目已移交 Linux 基金会下的 Agentic AI Foundation 管理。*来源:Vantage Academy / Hacker News*
- Microsoft Copilot Cowork 爆出文件泄露漏洞 — 安全研究人员披露 Microsoft Copilot Cowork 存在文件泄露安全漏洞(Hacker News 评分 165 分),引发企业对 AI 辅助办公安全性的广泛担忧。*来源:Hacker News*
- Claude 发现 Apple macOS 26.5 内核漏洞(CVE-2026-28952) — Apple macOS 内核漏洞由 Claude AI 安全研究团队发现并提交,标志着 AI 在代码安全审计领域的实际应用价值进一步得到验证。*来源:Hacker News*
- AI 幻觉引用正渗透进临床指南论文 — 研究人员警告,被 AI 幻觉生成的虚假引用正在悄悄进入影响临床指南制定的学术论文中,对医学实践构成潜在风险。*来源:The Decoder*
━━━ 模型 & 产品 ━━━
- Anthropic 发布 BioMysteryBench:Claude 在生物信息学任务上超越人类专家 — Anthropic 推出的 BioMysteryBench 基准测试包含 99 个真实生物信息学问题,Claude Opus 4.6 在人类可解问题上表现稳定,在人类难解问题上以 30% 的解决率超越 5 位领域专家组成的对照小组。*来源:Anthropic*
- Beyond Recall:行为规范作为 AI 个性化解释层 — Base Layer 发布新研究,提出”表征准确性”(representational accuracy)作为衡量 AI 系统理解用户的新轴心,并通过 Behavioral Specification(行为规范)文档实现。在 14 位历史人物的自传语料测试中,7K token 的规范文档达到 80-400K 原始语料同等预测准确率。*来源:Base Layer*
- ima Copilot 全面开放,知识号支持发布 Skill — ima 于 5 月 25 日开放两项重要能力:Copilot 功能全面开放(此前排队超 10 万人),知识广场支持通过知识号发布和发现 Skill,首批上线微信读书、腾讯招聘等 Skill。*来源:36氪*
- Show HN: Lavern — 开源多智能体法律系统(Apache 2.0) — 基于多 Agent 架构的开源法律系统,可在本地运行法律分析与文档处理工作流。*来源:HN Newest*
- Show HN: Apery — AI Agent 合成数据生成器 — 用于生成 AI Agent 训练所需合成数据的开源工具。*来源:HN Newest*
- Show HN: Rogue-Bench — LLM 玩 Rogue 游戏基准测试 — 让大语言模型玩经典游戏 Rogue 的新型基准测试,评估 LLM 在复杂环境中的决策能力。*来源:HN Show*
━━━ 🇨🇳 国内动态 ━━━
- 稚晖君彭志辉正式出任上纬新材董事长 — 前华为”天才少年”、B站 UP 主”稚晖君”彭志辉正式接任科创板公司上纬新材董事长,标志着智元机器人对其控制权收购整合最终落定。*来源:36氪*
- 特斯拉中国 FSD 更名为”特斯拉辅助驾驶”,10 国开放 — 特斯拉将 FSD 在中国正式更名为”特斯拉辅助驾驶”,同时宣布监督版 FSD 已在包括中国在内的 10 个国家或地区开放使用。*来源:36氪*
- 算电协同成为 2026 年资本市场重要产业主线 — 继东数西算之后,算电协同迎来政策与产业共振,首个大规模示范项目在宁夏中卫投运。*来源:36氪*
- 挪威部署 2PB 华为闪存用于 LLM 训练 — 挪威机构部署了 2PB 华为闪存存储系统用于大模型训练,反映了 AI 训练对存储基础设施的巨大需求。*来源:Hacker News*
━━━ 📖 今日推荐教程 ━━━
Block Goose Recipe Runner:用 YAML 文件构建可复用的 AI Agent 工作流
Block(Square 母公司)开源了其内部广泛使用的 AI Agent「Goose」,核心创新是 Recipe 模式——用 30 行 YAML 定义 Agent 的工具、参数和执行步骤,让非工程师也能编写 Agent 自动化流程。本文详细解析了架构设计和实际运行方法。
https://vantageacademy.io/post/block-goose-recipe-runner
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...