2026年5月13日 · 星期三

符号学习不是编程代理的替代品,而是梯度下降和神经网络的替代品——一种底层、完全通用、极高可扩展的新学习基板。

AI 不会导致大规模失业。AI 像任何技术一样确实影响就业,但夸大失业恐慌的故事是不负责任且有害的。技术浪潮终将创造更多岗位。

OpenAI Codex 现可跨应用后台操控计算机

Codex 的 Computer use 功能可在不接管 Mac 的情况下跨应用点击、输入并持续后台工作,Agent 形态的自动化正在成为现实。

OpenAI 推出 Symphony

每个待办任务自动分配一个运行中的 Codex agent,实现端到端自动化。Symphony 将 agent 从对话模型升级为任务编排引擎。

前 OpenAI CTO 公司发布多模态实时交互模型

Mira Murati 的 Thinking Machines 推出交互模型,能持续接收音视频文本等原生多模态输入,实时思考、响应和行动,打破传统 Agent 拼接。

新论文:自条件嵌入扩散模型,文本生成比肩自回归

Self-conditioned Embedding Diffusion 在连续嵌入空间进行文本扩散建模,生成质量媲美自回归模型且推理更高效,为扩散模型的规模化奠定基础。

physics-intern agent 框架提升理论物理模型表现

深度学习研究者发布 physics-intern 智能体框架,在 CritP 基准上将 Gemini 3.1 Pro 的准确率从 17.7% 提升至 31.4%。

新论文 TMAS 通过多智能体协同扩展测试时计算

TMAS 利用多智能体协同来扩展测试时计算,提升推理能力,为推理时计算扩展提供新思路。

数学家策划的 Soohak 基准评估大模型研究数学能力

由数学家策划的新基准 Soohak,专门用于评估大语言模型在研究级数学上的能力,填补现有数学基准的空白。

Elon Musk 宣布 Grok 已具备技能功能

Grok 新增技能模块,可能涉及新的插件或能力扩展,xAI 生态持续演化。

M3 Max 用户通过 DeepSeek V4 GGUF 实现本地 AI 体验

antirez 发布了 DeepSeek V4 的 GGUF 格式模型文件,使该模型可在本地设备上运行,社区调侃 M3 Max 用户先于 GTA 6 实现了本地 AGI。