2026年5月13日 · 星期三

Perplexity 发布 Qwen3 235B 在 Blackwell GPU 上的推理性能研究

GB200 NVL72 平台服务后训练 Qwen3 235B，吞吐量相比 Hopper 实现显著跃升，大模型推理基础设施迎来范式转折。

Perplexity 公布 Qwen3 235B 在 GB200 Blackwell 上的推理栈性能数据。

Perplexity AI 发布研究，展示在 NVIDIA GB200 NVL72 Blackwell 平台上服务后训练 Qwen3 235B 模型，吞吐量相比 Hopper 显著提升。研究量化了 GB200 在预填充与解码分离架构下的优势，尤其是对大型 MoE 模型的高吞吐推理场景。CEO Arav Srinivas 表示，GB200 改变了 Qwen 等大模型的部署方式，其团队已公布完整堆栈细节与性能对比数据。Blackwell 正从训练平台演进为推理时代的核心硬件。

Isomorphic Labs 获 21 亿美元融资

Demis Hassabis 宣布其 AI 药物研发公司 Isomorphic Labs 新获 21 亿美元资金，目标解决所有疾病。AlphaFold 开启的道路正加速通向重新构想药物发现的使命。

StepFun 发布 Step Image Edit 2

阶跃星辰推出 35 亿参数图像编辑模型，在 KRIS-Bench 基准上整体、事实及概念类别均排名第一，超越参数多 5–6 倍的模型，推理仅需 0.7 秒。

Claude Opus 4.7 快速模式开放研究预览

Anthropic 为 Claude Opus 4.7 推出快速模式，已在 API 和 Claude Code 中提供，速度提升 2.5 倍，成本 6 倍。Cursor 亦同步集成，推荐多数任务仍使用标准速度。

ModernColBERT 以 149M 参数近乎解决 BrowseComp-Plus

Reason-ModernColBERT 以仅 1.49 亿参数在 BrowseComp-Plus 基准上碾压 SOTA，性能超越参数多 54 倍的模型，展示检索增强推理的极端效率。

Google DeepMind 用 AI 重新设计鼠标指针

实验性 AI 指针融合动作、语音和自然速记，让用户直观地在屏幕上指挥 Gemini。五十年历史的接口正被 AI 重新发明。

符号学习不是编程代理的替代品，而是梯度下降和神经网络的替代品——一种底层、完全通用、极高可扩展的新学习基板。
François Chollet

谷歌发布 Gemini Intelligence，推动 Android 多步骤自动化

跨应用和 Chrome 自动化多步任务，单点填表，语音转文本，Google 将 Gemini 能力注入最先进设备。

Sundar Pichai 在 Android Show (I/O edition) 宣布 Gemini Intelligence。

谷歌 CEO Sundar Pichai 在 Android Show 上宣布 Gemini Intelligence，能跨应用和 Chrome 自动化多步任务，包括单点填表、名为 Rambler 的语音转文本等功能。这标志着 Gemini 从对话助手向设备级智能体的关键跃迁，用户无需在多个应用间切换即可完成复杂工作流。

Hugging Face Hub 公开数据集突破 100 万

Hugging Face 宣布其 Hub 上公开数据集数量达到 100 万，强调开放模型需要开放数据，感谢社区推动这一里程碑。AI 生态的数据基础正以前所未有的速度扩张。

Meta 静默发布 Sapiens2

Meta 推出 Sapiens2，一组在 10 亿人类图像上训练的高分辨率模型系列，用于姿态估计等视觉任务。

通义发布 Qwen-Image-2.0 技术报告

阿里通义千问图像模型 Qwen-Image-2.0 技术报告公开，预计包含架构细节与性能数据。

AI 不会导致大规模失业。AI 像任何技术一样确实影响就业，但夸大失业恐慌的故事是不负责任且有害的。技术浪潮终将创造更多岗位。
Andrew Ng 吴恩达

OpenAI Codex 现可跨应用后台操控计算机

Codex 的 Computer use 功能可在不接管 Mac 的情况下跨应用点击、输入并持续后台工作，Agent 形态的自动化正在成为现实。

OpenAI 推出 Symphony

每个待办任务自动分配一个运行中的 Codex agent，实现端到端自动化。Symphony 将 agent 从对话模型升级为任务编排引擎。

前 OpenAI CTO 公司发布多模态实时交互模型

Mira Murati 的 Thinking Machines 推出交互模型，能持续接收音视频文本等原生多模态输入，实时思考、响应和行动，打破传统 Agent 拼接。

新论文：自条件嵌入扩散模型，文本生成比肩自回归

Self-conditioned Embedding Diffusion 在连续嵌入空间进行文本扩散建模，生成质量媲美自回归模型且推理更高效，为扩散模型的规模化奠定基础。

physics-intern agent 框架提升理论物理模型表现

深度学习研究者发布 physics-intern 智能体框架，在 CritP 基准上将 Gemini 3.1 Pro 的准确率从 17.7% 提升至 31.4%。

新论文 TMAS 通过多智能体协同扩展测试时计算

TMAS 利用多智能体协同来扩展测试时计算，提升推理能力，为推理时计算扩展提供新思路。

数学家策划的 Soohak 基准评估大模型研究数学能力

由数学家策划的新基准 Soohak，专门用于评估大语言模型在研究级数学上的能力，填补现有数学基准的空白。

Elon Musk 宣布 Grok 已具备技能功能

Grok 新增技能模块，可能涉及新的插件或能力扩展，xAI 生态持续演化。

M3 Max 用户通过 DeepSeek V4 GGUF 实现本地 AI 体验

antirez 发布了 DeepSeek V4 的 GGUF 格式模型文件，使该模型可在本地设备上运行，社区调侃 M3 Max 用户先于 GTA 6 实现了本地 AGI。

黄仁勋 CMU 毕业演讲：以智慧引领 AI 未来

"答案不是惧怕未来，而是明智地引导它。"

NVIDIA CEO 黄仁勋在卡耐基梅隆大学 2026 年毕业典礼上表示，不应惧怕 AI 而应明智引导，呼吁乐观、责任和雄心。他回顾了从 GPU 到 AI 计算的三十年历程，勉励毕业生成为技术洪流中的掌舵者。

Mollick：AI 实验室若相信 ASI 将解散部署工程团队

"只要还需要人去理解 AI 如何有用，去做组织变革和系统集成，工作就似乎相当安全。"

Ethan Mollick 发表尖锐评论：AI 实验室声称 AGI/ASI 即将到来，但同时大量招募"前向部署工程师"去帮客户落地 AI。真正的 ASI 信仰意味取消这些团队。只要企业仍然需要人类来集成 AI 和管理变革，就业的终极威胁就尚未到来。如果 AI 真的无所不能，为什么还需要人类去帮客户搞清楚它有什么用、怎么做组织变革和系统集成？

业界速览2026 · 05 · 13

AI 气象