NVIDIA 首次交付 Vera CPU,专为 Agent AI 时代打造
NVIDIA 将首款自研 CPU Vera 送抵 Anthropic、OpenAI、SpaceX 和 Oracle Cloud,标志定制 AI 芯片里程碑。同时向 SpaceX 首批交付,感谢其试用。
NVIDIA 宣布其史上首款自研 CPU Vera 正式交付给 Anthropic、OpenAI、SpaceX 和 Oracle Cloud,标志着通用计算与 AI 加速深度融合的转折点。这款 CPU 专为 Agent AI 时代设计,并非传统 CPU,而是围绕大规模 Agent 推理与自主工作负载重新架构的芯片,预计将显著降低 Agent 系统的延迟与能耗。
Vera 的推出也呼应了 NVIDIA CEO 黄仁勋在同日 Dell TechWorld 上发表的联合同台主题演讲,与 Dell CEO Michael Dell 共同探讨企业 AI 的未来。NVIDIA 表示这只是开始,通往 Vera 驱动系统的道路刚刚开启。
Cursor 发布自研模型 Composer 2.5
Cursor 推出迄今最强编程模型,在长任务上更智能,并翻倍一周免费配额。
Cursor 发布全新自研模型 Composer 2.5,被描述为"迄今最强"。该模型在长时间持续性任务上表现更优,遵循复杂指令的可靠性大幅提升。Hugging Face CEO Clement Delangue 对此评论称"所有认真的 AI 公司最终都应基于开源自研模型,而非通过 API 外包"。xAI 团队亦表示该模型在强化学习方面取得突破,性能远超同量级参数模型。
Anthropic 收购 SDK 平台 Stainless
Stainless 自 Anthropic API 早期起即为其所有官方 SDK 提供支持,收购将优化开发者工具生态。
Anthropic 宣布收购 Stainless,后者是一家 SDK 及 MCP 服务器平台公司。自 Anthropic API 早期起,Stainless 一直为所有官方 SDK 提供支持。此次收购将帮助 Anthropic 整合开发者工具生态,进一步提升开发者体验。
这是 Anthropic 在构建完整 AI 开发平台方面的关键布局,也呼应了当天 Claude 生态的多项产品更新——Claude Code 快速模式默认启用 Opus 4.7、Claude Console 新增提示缓存诊断功能、以及官方发布大规模代码库中运行 Claude Code 的最佳实践博文。
Qwen3.7 预览版登陆 Arena 榜单
通义千问发布 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview,阿里在文本和视觉榜单分别位列第 6 和第 5。
Qwen3.7 系列预览版登上 Arena 排行榜,阿里巴巴实验室跻身文本榜第 6、视觉榜第 5。团队表示完整发布即将到来。同一天,智谱 GLM-5.1 也通过 OrcaRouter 上线,在 SWE-Bench Pro 上排名开源模型第一,超越部分闭源模型。中国的开源大模型阵营正以前所未有的速度推进。
不要被人类知识所干扰,AI 应聚焦于利用计算能力的通用方法。
—— Richard Sutton,强化学习之父,"苦涩教训"26 字版
Claude Code 快速模式默认启用 Opus 4.7
Claude Code 中的 /fast 模式现在默认使用 Opus 4.7 模型,提升效率。
Claude 控制台新增 Prompt 缓存诊断
当请求未命中缓存时,可精确查看提示中哪部分发生了更改及其消耗的 token 数。
Claude Code 规模化最佳实践博文发布
Claude 官方博客发布系列文章首篇,基于团队在百万行级单体仓库、数十年遗留系统和分布式微服务中的经验,总结成功部署的配置、工具和组织模式。
Codex 桌面应用支持远程连接
Codex 新增远程连接功能,可在手机端 ChatGPT 应用中操控 Mac 上保持运行的 Codex。
Google I/O 明日开幕,预告 AI 领域重大突破
Google 预告 I/O 2026 将发布 AI 领域的突破、工具和创新,直播将于明早 10 点 PT 开始。CEO Sundar Pichai 已动身前往现场。
黄仁勋与 Michael Dell 在 Dell TechWorld 同台演讲
NVIDIA CEO 与 Dell CEO 联合发表主题演讲,聚焦企业 AI 与 AI Factory 方案。
Hugging Face 在 Dell TechWorld 上展示了 Kimi K2.6、DeepSeek 等多模型选择方案,Michael Dell 强调"模型选择,无需基础设施混乱"。
Sam Altman:ChatGPT 更新后提升巨大
OpenAI CEO 称赞最新更新使 ChatGPT 表现大幅改善,对团队倍感骄傲。
Grok 代理模式是重大能力解锁
Elon Musk 称 Grok 的 agent 模式是重大功能突破。
Tether 在 iPhone 16 上微调 13B 模型
TechCrunch 报道 Tether 在 iPhone 16 上无需数据中心微调 13B 参数模型,实现完全隐私。
PapersWithCode 宣布复兴
Niels Rogge 宣布重启 PapersWithCode 平台,重新聚焦研究论文与代码链接。
llama.cpp 支持 MTP,本地模型速度跃升
Qwen3.6-27B 在 A10 上借助多令牌预测支持,可作为日常模型使用。
François Chollet 分享编码 Agent 方法论
Chollet 将编码 Agent 比作盲松鼠,需通过可验证的约束引导它们找到正确区域。
Runway 角色现在可执行工具调用
Runway Characters 新增行动能力,可基于用户指令调用工具,超越单纯对话。
Altara 使用 OpenAI 模型处理科研数据
OpenAI 案例展示:利用其模型帮助科学家处理多模态复杂科研数据。
Zoom 插件登陆 Codex
Codex 新增 Zoom 插件,支持调用会议转录并分析内容。
马斯克起诉 OpenAI 案败诉:输在"告晚了"
加州奥克兰联邦法院陪审团一致裁定马斯克对 OpenAI 和 Sam Altman 的诉讼超过法定时效,全部主张被驳回。
陪审团评议不到两小时即作出裁决,法官 Yvonne Gonzalez Rogers 随后亦驳回了马斯克的上诉请求,认定关于诉讼时效的裁定有效。马斯克的律师 Marc Toberoff 表示将提出上诉。
ChatGPT Images 2.0 在印度已生成超 10 亿张
Sam Altman 宣布 ChatGPT Images 2.0 在印度累计创建超 10 亿张图片。
该数字反映了 AI 图像生成工具在新兴市场的迅猛渗透。
Nathan Lambert:在线蒸馏将成为持久训练方法
在线策略蒸馏有望成为继指令微调、RLHF、DPO、RLVR 之后的新一类训练方法,此类方法的核心突破极为罕见。
MIT 发布教学强化学习新方法
MIT 提出 Pedagogical RL,主要教训是即使正确的推理轨迹也可能导致不良训练信号。
Abridge 处理超 1 亿医疗对话,构建临床智能层
AI 医疗公司 Abridge 通过处理超过 1 亿次医患对话,实现实时预先授权审批,医生每周可节省 10 至 20 小时工作时间。
全面指南发布:如何评估 AI Agent
涵盖 Agent 基础概念、评估模式与框架、及著名基准案例研究。
前员工比较 Anthropic 与 DeepMind 研究文化
曾同时在两家公司工作的人士表示,在 Anthropic 无需权限即可获取计算资源进行纯研究,无需交易计算资源或承诺未来。
AI 问题需要全社会参与
AI 带来的问题超越技术界,需要宗教、公民社会、学术界和政府共同创造积极结果。
Black Forest Labs 发布官方 FLUX MCP
FLUX 模型 MCP 服务发布,可在 Claude、Cursor 等工具中直接生成图像,从草稿到生产级资产自动路由到合适模型。
vLLM 现可在 GH200/GB200/GB300 直接安装
pip install vllm 在 NVIDIA 最新硬件上直接可用,感谢 PyTorch 和 NVIDIA 的跨项目协作。
9B 工具调用模型发布
Kyle Hessling 发布了一个 9B 参数模型,专门针对工具调用和 Agent 编程训练。
NVIDIA 发布 Nemotron CLIMB 代理模型
NVIDIA 在 Hugging Face 上发布 62M 和 350M 参数的 Nemotron CLIMB Proxy 模型。
UNI-1.1 在 Image Arena 排名第 7
Luma Labs 的 UNI-1.1 以 1254 Elo 分位列 Image Arena 第 7,跻身图像生成三强,在参考生成和电影构图上表现出色。
GLM-5.1 上线 OrcaRouter,SWE-Bench Pro 开源第一
智谱 GLM-5.1 现可通过 OrcaRouter 使用,在 SWE-Bench Pro 上排名第一,超越部分闭源模型。
Elon Musk 推广新模型,部分基于 Colossus 2 训练
马斯克邀请用户试用新模型,该模型部分基于 Colossus 2 算力训练。
Codex 新增 /goal 持久目标模式
Greg Brockman 介绍 /goal 命令,可让模型持续解决指定目标直到完成。