MiniMax 发布 M3:首个结合三大前沿能力的开源模型
59.0% SWE-Bench Pro、1M 上下文、原生多模态、稀疏注意力架构 — 用 1/10 的成本逼近 GPT-5.5 与 Opus。
MiniMax 正式发布 M3,这是首个同时在前沿编程、Agent 能力和原生多模态三个维度达到前沿水平的开源权重模型。SWE-Bench Pro 得分 59.0%,Terminal Bench 2.1 得分 66.0%,在 Next.js AI 智能体评估中仅次于 Opus 和 GPT-5.5 成为领先开源模型。M3 采用 MiniMax Sparse Attention 架构,将上下文窗口扩展到 1M tokens,同时支持图像、视频和音频输入。M3 发布当日即登陆 Vercel AI Gateway、Ollama Cloud、Cloudflare AI Gateway、OpenRouter 等十余个平台,首批合作方推出首周 50% 折扣。
NVIDIA 发布 RTX Spark:1 Petaflop 个人 AI 超级芯片
完整 CUDA 和 RTX 生态,支持 Windows 原生 AI 智能体,个人计算新纪元的开端。
NVIDIA 发布 RTX Spark,一款 1 petaflop 级超级芯片,将完整的 CUDA 和 RTX 生态系统装入个人电脑形态。该芯片专为本地运行大型 AI 模型设计,支持 Windows 原生 AI 智能体。同期微软与 NVIDIA 宣布联手,将 Grace 和 Blackwell 芯片集成进笔记本电脑,直接挑战苹果 Silicon 长达六年的统治地位。Adobe 亦宣布与 NVIDIA 合作,在 Photoshop、Premiere 和 Substance 3D 中利用 RTX Spark 优化 AI 工作流,创作者等待渲染的时间大幅缩短。vLLM 项目已宣布与 RTX Spark 合作在 DGX Spark 上本地运行 NVFP4 大模型。
NVIDIA Vera Rubin 平台全面投产,面向 Agentic AI 时代
NVIDIA 宣布 Vera Rubin 多机架 pod 级系统已进入全面生产阶段。该系统通过极限协同设计,将五款互联机架规模系统融为一体,包括 Vera Rubin NVL72、Vera CPU 机架、Groq 3 LPX 等组件,专为处理大规模 Agentic AI 工作负载而打造。这标志着 AI 基础设施从单机训练集群向多机协同推理平台的战略转型。
OpenAI 前沿模型登陆 AWS Bedrock
OpenAI 的 frontier 模型和 Codex 现已通过 Amazon Bedrock 向企业提供。企业可在已信任的 AWS 安全合规框架内调用 OpenAI 模型,构建 AI 应用和软件工程工作流。OpenAI 表示这仅是更广泛企业扩张的起点,后续将有更多区域和模型上线。
xAI 发布 Composer 2.5,集成 Grok Build
Composer 2.5 是一款快速、高智能模型,在长任务和复杂指令遵循方面表现卓越,现已全面集成到 Grok Build 平台中。
阿里发布 Qwen3.7-Plus 多模态 Agent 模型
Qwen3.7-Plus 统一视觉与语言,支持多模态交互混合 Agent,可在 GUI 与 CLI 间无缝切换,适用于编码和生产任务场景。
Runway 与 NVIDIA 等成立 Cosmos Coalition
Runway 作为创始成员加入 Cosmos Coalition,与 NVIDIA 及多家顶尖 AI 实验室共同构建和开源前沿物理世界模型,推动 Physical AI 发展。
M3 登陆 Vercel AI Gateway
MiniMax M3(1M 上下文、多模态输入)现已在 Vercel AI Gateway 可用,首周提供 50% 折扣。
M3 在 Next.js Agent 评估中领先开源模型
MiniMax M3 在 Vercel Next.js AI 智能体评估中成为领先的开源模型,仅次于 Opus 和 GPT-5.5,成本仅为 1/10。
发布 Agent 记忆插件 Hy-Memory
Hy-Memory 基于 6 层记忆框架与 System1/System2 双系统,专为长期协作 Agent 设计,提供真正的"第二大脑"能力。
Runway 设立伦敦欧洲总部
Runway 宣布伦敦为欧洲总部及世界模型研究中心,计划 18 个月内投资 1 亿美元并持续扩展至 2028 年。
Luma 成立开放物理 AI 实验室
Luma 建立开放科学物理 AI 实验室,聚焦解决物理 AI 的泛化问题,推动 AI 从数字领域进入物理世界。
推出 Search as Code 搜索新架构
Perplexity 发布 Search as Code 架构,允许 Agent 直接编写 Python 调用搜索栈,取代逐次函数调用,已默认用于 Computer 模式。
语音黑客松冠军:Agentic OS
语音优先手机操作系统 Agentic OS 获得 OpenAI 语音黑客松最佳人气奖,用户可通过语音与智能体交互操作手机,获得 5 万美元 API 积分。
Claude 重置速率限制并修复子 Agent 问题
Claude 为 Pro 和 Max 用户重置 5 小时与每周速率限制,修复了 Claude Code 中子 Agent 过度并行导致消耗过快的问题。
vLLM 与 RTX Spark 合作推动本地 Agent
vLLM 宣布与 NVIDIA RTX Spark 合作,在 DGX Spark 上本地运行大模型,支持 NVFP4 量化模型。
Runway Aleph 2.0 推出快速蒙版功能
Aleph 2.0 可在数秒内创建合成蒙版,精准隔离视频主体,用于合成、调色或特效处理,大幅简化后期工作流。
Replit:单个 Prompt 即可构建完整商业应用
Replit 推出新功能,用户可从一个提示词生成网站、移动应用、幻灯片和发布视频,并提供 Stripe、QuickBooks 等合作方权益。
「AI Forward Deployed Engineer 正成为硅谷最热门的新职位——工程师直接嵌入客户组织,定制方案、构建和调优 Agent 工作流。」
vLLM-Omni 零日支持 NVIDIA Cosmos 3
vLLM-Omni 提供对 Cosmos 3 的首日支持,该模型融合自回归推理与扩散生成,覆盖文本、图像、视频、音频和机器人动作模态,通过统一的 OpenAI 兼容 API 提供服务。
GrepSeek:训练搜索智能体直接交互语料
GrepSeek 研究如何训练搜索智能体直接与语料库交互,绕开传统检索管道(retrieval pipeline),实现端到端的语料搜索与推理。
MiniMax M3 登陆 Ollama Cloud
Ollama Cloud 现已支持 MiniMax M3 模型,美国区域运行,零数据留存,可用于 Claude Code 和 Codex 等编码与 Agent 任务。
Step 3.7 Flash 在 kilocode 免费提供
Step 3.7 Flash 在 kilocode 中免费使用,专为编码 Agent 多步编排和可靠工具调用设计。
微软与 NVIDIA 联手将 AI 芯片装入笔记本
Grace 与 Blackwell 芯片进入笔记本形态,微软和 NVIDIA 合作挑战苹果 Silicon 长达六年的统治。
Adobe 与 NVIDIA 合作优化创意工作流
Adobe 在 Photoshop、Premiere 等应用中集成 RTX Spark,AI 渲染与编辑速度提升最高 2 倍。
NVIDIA GTC 台北主题演讲:重新定义 AI 未来
Jensen Huang 在 GTC Taipei 登台,发布 AI 基础设施、自主智能体、物理 AI 与机器人及新一代个人 AI 计算平台。
NVIDIA GTC 亮点回顾
黄仁勋展示全球 AI 工厂基础设施蓝图,涵盖自主 Agent、Physical AI 和机器人技术在多行业落地案例。