Claude Opus 4.7 快速模式开放研究预览
Anthropic 为 Claude Opus 4.7 推出快速模式,已在 API 和 Claude Code 中提供,速度提升 2.5 倍,成本 6 倍。Cursor 亦同步集成,推荐多数任务仍使用标准速度。
ModernColBERT 以 149M 参数近乎解决 BrowseComp-Plus
Reason-ModernColBERT 以仅 1.49 亿参数在 BrowseComp-Plus 基准上碾压 SOTA,性能超越参数多 54 倍的模型,展示检索增强推理的极端效率。
Google DeepMind 用 AI 重新设计鼠标指针
实验性 AI 指针融合动作、语音和自然速记,让用户直观地在屏幕上指挥 Gemini。五十年历史的接口正被 AI 重新发明。
符号学习不是编程代理的替代品,而是梯度下降和神经网络的替代品——一种底层、完全通用、极高可扩展的新学习基板。
François Chollet
AI 不会导致大规模失业。AI 像任何技术一样确实影响就业,但夸大失业恐慌的故事是不负责任且有害的。技术浪潮终将创造更多岗位。
Andrew Ng 吴恩达
OpenAI Codex 现可跨应用后台操控计算机
Codex 的 Computer use 功能可在不接管 Mac 的情况下跨应用点击、输入并持续后台工作,Agent 形态的自动化正在成为现实。

OpenAI 推出 Symphony
每个待办任务自动分配一个运行中的 Codex agent,实现端到端自动化。Symphony 将 agent 从对话模型升级为任务编排引擎。
前 OpenAI CTO 公司发布多模态实时交互模型
Mira Murati 的 Thinking Machines 推出交互模型,能持续接收音视频文本等原生多模态输入,实时思考、响应和行动,打破传统 Agent 拼接。

新论文:自条件嵌入扩散模型,文本生成比肩自回归
Self-conditioned Embedding Diffusion 在连续嵌入空间进行文本扩散建模,生成质量媲美自回归模型且推理更高效,为扩散模型的规模化奠定基础。
physics-intern agent 框架提升理论物理模型表现
深度学习研究者发布 physics-intern 智能体框架,在 CritP 基准上将 Gemini 3.1 Pro 的准确率从 17.7% 提升至 31.4%。
新论文 TMAS 通过多智能体协同扩展测试时计算
TMAS 利用多智能体协同来扩展测试时计算,提升推理能力,为推理时计算扩展提供新思路。

数学家策划的 Soohak 基准评估大模型研究数学能力
由数学家策划的新基准 Soohak,专门用于评估大语言模型在研究级数学上的能力,填补现有数学基准的空白。

Elon Musk 宣布 Grok 已具备技能功能
Grok 新增技能模块,可能涉及新的插件或能力扩展,xAI 生态持续演化。
M3 Max 用户通过 DeepSeek V4 GGUF 实现本地 AI 体验
antirez 发布了 DeepSeek V4 的 GGUF 格式模型文件,使该模型可在本地设备上运行,社区调侃 M3 Max 用户先于 GTA 6 实现了本地 AGI。

黄仁勋 CMU 毕业演讲:以智慧引领 AI 未来
"答案不是惧怕未来,而是明智地引导它。"
NVIDIA CEO 黄仁勋在卡耐基梅隆大学 2026 年毕业典礼上表示,不应惧怕 AI 而应明智引导,呼吁乐观、责任和雄心。他回顾了从 GPU 到 AI 计算的三十年历程,勉励毕业生成为技术洪流中的掌舵者。
Mollick:AI 实验室若相信 ASI 将解散部署工程团队
"只要还需要人去理解 AI 如何有用,去做组织变革和系统集成,工作就似乎相当安全。"
Ethan Mollick 发表尖锐评论:AI 实验室声称 AGI/ASI 即将到来,但同时大量招募"前向部署工程师"去帮客户落地 AI。真正的 ASI 信仰意味取消这些团队。只要企业仍然需要人类来集成 AI 和管理变革,就业的终极威胁就尚未到来。如果 AI 真的无所不能,为什么还需要人类去帮客户搞清楚它有什么用、怎么做组织变革和系统集成?
NVIDIA Earth-2 助力延长冰雹预警时间
科罗拉多州立大学利用 Earth-2 和 PhysicsNeMo,将冰雹预测提前时间从分钟级提升至小时级,生成式 AI 与高分辨率雷达数据协同实现实时可扩展预报。

Luma Agents 推出广告优化与创意生成工具
Luma 发布 Luma Agents,可帮助团队设定优化方向,生成更高性能的广告版本,涵盖创意和文案的全流程迭代。

LlamaIndex 发布自托管文档解析服务器 liteparse
开源、完全自托管的文档解析服务,支持 PDF、Office 文件和图片的本地解析与截图,保障数据隐私。

知乎解析 Slime:最优雅舒适的 RL 训练框架
深度文章介绍 Slime 框架如何重新定义大模型强化学习训练,被赞为 RL 训练框架中的优雅之作。
Anthropic 推出 Claude for Legal
12 个岗位插件与 20+ MCP 连接器覆盖法务、并购、隐私等领域。
Ethan Mollick 批评 ChatGPT 取消学习模式
助手模式会直接给答案,损害真实学习效果,Claude 和 Gemini 仍保留类似功能。
Sakana AI 发布 KAME 实时语音对话架构
串联快速语音模型与后端大模型,实时注入知识提升语音对话质量。
Rebellious Student 逆向推理探索
反转教师信号进行推理探索的自我蒸馏 RLVR 方法。
Pixal3D 像素对齐 3D 生成
从图像生成高保真 3D 资产,投稿 SIGGRAPH 2026。
Jeff Dean 转发 Open Defense Initiative
最高 500 万美元积分保护关键开源项目,涉及 AI 安全。
Unsloth 发布 Qwen3.6 量化 GGUF
启用 MTP 的 Qwen3.6-35B-A3B 量化版本,简化本地推理部署。
Cursor 集成 Claude Opus 4.7 快速模式
速度 2.5 倍,推荐多数任务仍使用标准速度以获得更优质量。
OpenMed Agent 预览版发布
基于 HF 端点的临床提取和术语处理,面向医疗任务的智能代理。
MiniMax M2.7 通过 LilacML 平滑迁移
M2.7 模型在 LilacML 帮助下更易于部署和使用。








