
1. Mistral Leanstral 1.5 开源发布:形式化数学基准满分,Apache-2.0 协议
Mistral AI 发布了 Leanstral 1.5,一款专为 Lean 4 形式化验证设计的开源模型,仅 6B 活跃参数,采用 Apache-2.0 协议。该模型在 miniF2F 基准测试中达到 100%,在 PutnamBench 上解决了 587/672 道题(87.4%),大幅超越 Opus 4.6,而推理成本仅为其七分之一。Leanstral 1.5 在扫描 57 个开源仓库 时发现了 5 个真实 bug。模型已在 Hugging Face 开放下载。
2. Anthropic 双线出击:自研药物发现 + Claude Science Beta
Anthropic 宣布启动 自有药物发现项目,针对大型制药公司认为”无利可图”的罕见病领域。Novartis CEO 指出 AI 可将新药开发周期从 12 年缩短至 7-8 年,成功率从 8% 翻倍至 16%。同时推出 Claude Science Beta——多 Agent AI 工作台,支持基因组学、蛋白质组学,集成 NVIDIA BioNeMo,并提供 最高 3 万美元积分 给 50 个研究项目。首批客户包括 Novo Nordisk 和 Allen Institute。
3. 阿里封杀 Claude 全线产品 vs 微软 25 亿美元 AI 部署军团
阿里巴巴 内部要求 7 月 10 日前卸载 Anthropic 全线产品(Sonnet/Opus/Fable/Claude Code),因 Claude Code 被检测到检查用户时区和访问域名,存在安全隐忧。与此同时,微软 宣布成立 Frontier Company,25 亿美元 + 6000 名工程师 入驻企业客户现场部署 AI。一退一进,折射出中美 AI 产业的截然路径。
4. NVIDIA 连发 HORIZON + ASPIRE 双 Agent 框架
NVIDIA 发布 HORIZON——全自动 RTL 代码生成 Agent,实现 100% 基准完成率;以及 ASPIRE——自改进机器人框架,在 LIBERO-Pro 长程任务上达 31% 零样本成功率。ASPIRE 的 Agentic Skill Discovery 让机器人可自主编程、测试、诊断和修复操作技能。
5. OpenAI 联合创始人预言”几乎无界面”的未来
OpenAI 联合创始人描绘了一个激进未来:“几乎没有任何界面”,没有人再需要学习软件操作,所有交互通过自然语言完成。他认为当前 GUI 范式将在 5-10 年内被 AI 原生的对话式交互取代,与 Andrej Karpathy 的”软件正在消亡”论调相呼应。
📌每日更新 / 🔥AI早报|📖道德经|🛠AI教程 / 📝博客:a.aijourney.vip / 🔧导航:AI Journey