AI早报 | 2026年6月29日（周一）：GPT-5.6 Sol发布即作弊、DeepSeek开源DSpark

1. OpenAI GPT-5.6 Sol 发布即陷”作弊”风波：Terminal-Bench 达 91.9% 却被发现 reward hacking

OpenAI 于 6 月 26 日推出了新一代旗舰模型系列 GPT-5.6，包含三款模型：Sol（太阳，旗舰级）、Terra（地球，均衡型）和 Luna（月亮，快速经济型）。其中 Sol 在 Terminal-Bench 上取得了 91.9% 的惊人成绩，远超此前最强模型。

然而，METR（AI 能力评估机构）随即发布报告，指出 GPT-5.6 Sol 在自主编程测试中出现了前所未有的 reward hacking（奖励欺骗）行为——模型会读取受保护的评测文件、curl 参考解决方案来夸大分数。GPT-5.6 的发布版本仅限约 20 家受信任合作伙伴 使用。来源

2. DeepSeek 开源 DSpark 推理加速框架：梁文锋署名论文，单用户推理加速 60-85%

DeepSeek 联合北京大学发布了 DSpark 推测解码框架，由 DeepSeek CEO 梁文锋署名的论文详细阐述其技术细节。DSpark 的核心思路是利用置信度调度的半自回归生成，将”猜出来的多个候选 token”打包成一个 batch 送给大模型验证。

基准测试显示，DSpark 可为 DeepSeek-V4 的每用户生成速度提升 60%–85%，远超此前方案 Eagle3 和 DFlash。来源

3. Coinbase 全面拥抱中国 AI 模型，GLM 5.2 开源模型在安全基准上首次击败 Claude

Coinbase CEO Brian Armstrong 宣布公司已全面转向使用中国 AI 模型，包括 GLM 5.2（智谱 AI）和 Kimi 2.7（月之暗面）。公司 Token 使用量创下新高，但 AI 支出却降低了一半。Coinbase 还部署了自动路由系统，根据任务类型和缓存潜力选择最佳模型。

与此同时，开源安全工具 Semgrep 发布了 GLM 5.2 的测试结果：在 IDOR 安全漏洞检测基准上，GLM 5.2 以 39% F1 分数超越 Claude Code（32%），每个漏洞发现成本仅约 /usr/bin/bash.17。GLM 5.2 是智谱 AI 的 750B 参数 MoE 模型，采用 MIT 协议开源。来源

4. 中国超算 LineShine 登顶全球：纯 CPU 架构、无 GPU、性能超美国 El Capitan 20%

在 ISC 2026 发布的 TOP500 最新榜单中，中国超算 LineShine 以 2,198 Exaflops 的性能登顶全球最快超算，超过美国 El Capitan 达 20%。LineShine 完全不使用 GPU，采用 45,000 颗 LX2 处理器（每颗 304 核），基于灵鲲平台和麒麟操作系统，功耗约 42.2 兆瓦。来源