2026年6月13日 · 星期六

月之暗面开源 Kimi K2.7-Code 编程模型

在 K2.6 基础上提升 21.8% 编程性能，推理效率提升 30%，减少过度思考。1T 参数 MoE 架构，32B 激活参数，256K 上下文窗口。

Kimi K2.7-Code 模型架构展示 · @Kimi_Moonshot 开源发布

月之暗面正式发布并开源了最新的编程模型 Kimi K2.7-Code。该模型基于 K2.6 构建，专为编程与智能体任务设计。据官方数据，在 Kimi Code Bench v2 上较前代提升 21.8%，Program Bench 提升 11.0%，MLS Bench Lite 提升 31.5%。推理效率方面，思考 token 较 K2.6 减少约 30%，在保持高准确率的同时大幅降低响应延迟。vLLM 项目随后披露了详细规格：1T 参数 Mixture-of-Experts 架构，每个 token 仅激活 32B 参数，搭配 MLA 注意力机制与 256K token 上下文窗口，使其在长程编程任务上具备显著优势。模型权重与代码已在 Hugging Face 开放。

MiniMax M3 开源发布：稀疏注意力开启新范式

约428B总参数、23B激活参数，MSA 稀疏注意力架构支持 1M token 上下文，权重已在 Hugging Face 开放。

MiniMax 发布 M3 开源模型，以约 428B 总参数中仅激活 23B 的高效架构，同时覆盖前沿编程、长时智能体任务与原生多模态（文本、图像、视频）。核心创新 MSA 稀疏注意力架构在长序列上实现显著加速。M3 是目前极少数同时具备全部上述能力的开放权重模型。发布当日即获得 SGLang、Fireworks AI、Modular、Unsloth 等多家平台首日支持，NVIDIA 亦提供免费 GPU 加速端点供社区体验。

计算正经历六十年来最大的转变——从检索走向生成，这是一次数万亿美元级别的机遇。
—— 黄仁勋，NVIDIA CEO

Delangue 批评 AI 评估体系偏向闭源 API

路由、降级与集成优化缺乏透明性，开源模型被系统性置于不利位置。

Hugging Face 联合创始人 Clement Delangue 公开质疑当前 AI 评估体系。他指出闭源 API 可通过路由、降级、集成与优化在评估中获得结构性优势，而开源模型缺乏这些隐藏机制。他以 Artificial Analysis 的对比图表为例，质疑"用一个模型对比两个模型"的公平性。Delangue 进一步讨论了"分割谬误"：即使去掉降级机制后 Opus 4.8 单项得分较低，总平均分也不一定更高。这番评论引发了模型评估透明度的广泛讨论。

NVIDIA 联合推出首个 Agent 基础设施基准

AgentPerf 专为评估智能体工具使用与上下文迭代能力而设计。

NVIDIA 与 Artificial Analysis 联合发布 AgentPerf，业界首个针对智能体 AI 基础设施的基准。现有基准未考虑智能体链式调用数十甚至上百次模型、使用工具、收集上下文并迭代执行的特点。AgentPerf 专门评估复杂工具调用和长链推理场景下的基础设施表现，标志着 AI 评估从单一模型能力向智能体系统能力的范式转移。

vLLM 深度解析 Kimi K2.7-Code 与 MiniMax M3 技术架构

两大开源模型同日登场，1T MoE 与 MSA 稀疏注意力代表两条不同技术路线。

vLLM 项目在同日连续发布了针对 Kimi K2.7-Code 和 MiniMax M3 的技术分析。K2.7-Code 采用 1T 参数 MoE、32B 激活、MLA 注意力与 256K 上下文的组合；M3 则以 428B 总参、23B 激活、MSA 稀疏注意力和 1M 上下文窗口著称。两套架构代表了"高精度少激活"和"长上下文新注意力"两条不同路径。就在同一天，SGLang 在 GB300 NVL72 上创下单 GPU 超 12K token/s 的推理新纪录，驱动 DeepSeek V4 Pro 1.6T 模型，进一步证明推理基础设施的快速进化。

Vercel 发布 HarnessAgent 统一编排抽象层

基于 AI SDK 构建，解除模型与 Agent 锁定，提供跨平台可移植体验。

Vercel 推出 HarnessAgent，一套统一编排抽象，允许开发者将任意 Agent 的"大脑"集成到应用之中。该方案解除模型和 Agent 供应商锁定，在跨平台可移植性之外保持了优雅的开发体验。这一发布标志着 AI 应用开发正在从"选模型"转向"编排 Agent"的新阶段。

Claude Code + Fable 重建失传经典 SimRefinery

基于幸存截图，完整复刻为可玩的 3D 炼油厂模拟，展示 AI 编程能力跃迁。

开发者 Emollick 利用 Claude Code 搭配 Fable，基于 1990 年代 Maxis/Chevron 合作的失传培训游戏 SimRefinery 的幸存截图与文档，成功重建了完整可玩的 3D 版本。新版本包含学习模式与自由建造，采用 three.js 构建，可模拟炼油厂运营、维护和爆炸场景。与 10 个月前旧版对比，AI 编程能力进步惊人。

产品与平台06.13

@OpenAIDevs