2026年6月2日 · 星期二

MiniMax M3 基准测试概览

MiniMax 发布 M3:首个结合三大前沿能力的开源模型

59.0% SWE-Bench Pro、1M 上下文、原生多模态、稀疏注意力架构 — 用 1/10 的成本逼近 GPT-5.5 与 Opus。

MiniMax 正式发布 M3,这是首个同时在前沿编程、Agent 能力和原生多模态三个维度达到前沿水平的开源权重模型。SWE-Bench Pro 得分 59.0%,Terminal Bench 2.1 得分 66.0%,在 Next.js AI 智能体评估中仅次于 Opus 和 GPT-5.5 成为领先开源模型。M3 采用 MiniMax Sparse Attention 架构,将上下文窗口扩展到 1M tokens,同时支持图像、视频和音频输入。M3 发布当日即登陆 Vercel AI Gateway、Ollama Cloud、Cloudflare AI Gateway、OpenRouter 等十余个平台,首批合作方推出首周 50% 折扣。

NVIDIA RTX Spark 超级芯片

NVIDIA 发布 RTX Spark:1 Petaflop 个人 AI 超级芯片

完整 CUDA 和 RTX 生态,支持 Windows 原生 AI 智能体,个人计算新纪元的开端。

NVIDIA 发布 RTX Spark,一款 1 petaflop 级超级芯片,将完整的 CUDA 和 RTX 生态系统装入个人电脑形态。该芯片专为本地运行大型 AI 模型设计,支持 Windows 原生 AI 智能体。同期微软与 NVIDIA 宣布联手,将 Grace 和 Blackwell 芯片集成进笔记本电脑,直接挑战苹果 Silicon 长达六年的统治地位。Adobe 亦宣布与 NVIDIA 合作,在 Photoshop、Premiere 和 Substance 3D 中利用 RTX Spark 优化 AI 工作流,创作者等待渲染的时间大幅缩短。vLLM 项目已宣布与 RTX Spark 合作在 DGX Spark 上本地运行 NVFP4 大模型。


AI 动态速览 06.02
MiniMax · Vercel

M3 登陆 Vercel AI Gateway

MiniMax M3(1M 上下文、多模态输入)现已在 Vercel AI Gateway 可用,首周提供 50% 折扣。

MiniMax · Next.js

M3 在 Next.js Agent 评估中领先开源模型

MiniMax M3 在 Vercel Next.js AI 智能体评估中成为领先的开源模型,仅次于 Opus 和 GPT-5.5,成本仅为 1/10。

腾讯混元

发布 Agent 记忆插件 Hy-Memory

Hy-Memory 基于 6 层记忆框架与 System1/System2 双系统,专为长期协作 Agent 设计,提供真正的"第二大脑"能力。

Runway · 欧洲

Runway 设立伦敦欧洲总部

Runway 宣布伦敦为欧洲总部及世界模型研究中心,计划 18 个月内投资 1 亿美元并持续扩展至 2028 年。

Luma Labs

Luma 成立开放物理 AI 实验室

Luma 建立开放科学物理 AI 实验室,聚焦解决物理 AI 的泛化问题,推动 AI 从数字领域进入物理世界。

Perplexity

推出 Search as Code 搜索新架构

Perplexity 发布 Search as Code 架构,允许 Agent 直接编写 Python 调用搜索栈,取代逐次函数调用,已默认用于 Computer 模式。

OpenAI

语音黑客松冠军:Agentic OS

语音优先手机操作系统 Agentic OS 获得 OpenAI 语音黑客松最佳人气奖,用户可通过语音与智能体交互操作手机,获得 5 万美元 API 积分。

Claude

Claude 重置速率限制并修复子 Agent 问题

Claude 为 Pro 和 Max 用户重置 5 小时与每周速率限制,修复了 Claude Code 中子 Agent 过度并行导致消耗过快的问题。

vLLM · NVIDIA

vLLM 与 RTX Spark 合作推动本地 Agent

vLLM 宣布与 NVIDIA RTX Spark 合作,在 DGX Spark 上本地运行大模型,支持 NVFP4 量化模型。


「AI Forward Deployed Engineer 正成为硅谷最热门的新职位——工程师直接嵌入客户组织,定制方案、构建和调优 Agent 工作流。」

MiniMax M3 生态速报 首发日集成

© 2026 FAV0 · AI Daily