2026年6月2日 · 星期二

Anthropic 秘密提交 IPO 申请
AI 行业迎来资本市场的分水岭

Claude 母公司已向 SEC 提交 S-1 注册声明草案，OpenAI 同日宣布前沿模型全线登陆 AWS Bedrock，AI 双巨头在一个交易日内同时释放战略级信号。

人工智能公司 Anthropic 已向美国证券交易委员会（SEC）秘密提交了 S-1 注册声明草案。待 SEC 完成审查后，该公司可选择进行首次公开募股（IPO）。这标志着继 Palantir、Snowflake 之后，新一代 AI 原生企业正式叩响公开市场大门。与此同时，OpenAI 宣布其 frontier 模型和 Codex 现已通过 Amazon Bedrock 向企业全面开放，支持安全合规的工作流部署。两条消息叠加传递了一个清晰信号：AI 行业正从技术竞赛进入商业化与资本化的双重加速期。Anthropic 的 Claude 系列模型已是 OpenAI 最强劲的竞争对手之一，其 IPO 若成行将为整个 AI 赛道提供首个公开市场估值锚点。

MiniMax M3 基准测试概览

MiniMax 发布 M3：首个结合三大前沿能力的开源模型

59.0% SWE-Bench Pro、1M 上下文、原生多模态、稀疏注意力架构 — 用 1/10 的成本逼近 GPT-5.5 与 Opus。

MiniMax 正式发布 M3，这是首个同时在前沿编程、Agent 能力和原生多模态三个维度达到前沿水平的开源权重模型。SWE-Bench Pro 得分 59.0%，Terminal Bench 2.1 得分 66.0%，在 Next.js AI 智能体评估中仅次于 Opus 和 GPT-5.5 成为领先开源模型。M3 采用 MiniMax Sparse Attention 架构，将上下文窗口扩展到 1M tokens，同时支持图像、视频和音频输入。M3 发布当日即登陆 Vercel AI Gateway、Ollama Cloud、Cloudflare AI Gateway、OpenRouter 等十余个平台，首批合作方推出首周 50% 折扣。

NVIDIA RTX Spark 超级芯片

NVIDIA 发布 RTX Spark：1 Petaflop 个人 AI 超级芯片

完整 CUDA 和 RTX 生态，支持 Windows 原生 AI 智能体，个人计算新纪元的开端。

NVIDIA 发布 RTX Spark，一款 1 petaflop 级超级芯片，将完整的 CUDA 和 RTX 生态系统装入个人电脑形态。该芯片专为本地运行大型 AI 模型设计，支持 Windows 原生 AI 智能体。同期微软与 NVIDIA 宣布联手，将 Grace 和 Blackwell 芯片集成进笔记本电脑，直接挑战苹果 Silicon 长达六年的统治地位。Adobe 亦宣布与 NVIDIA 合作，在 Photoshop、Premiere 和 Substance 3D 中利用 RTX Spark 优化 AI 工作流，创作者等待渲染的时间大幅缩短。vLLM 项目已宣布与 RTX Spark 合作在 DGX Spark 上本地运行 NVFP4 大模型。

NVIDIA Vera Rubin 多机架系统

NVIDIA Vera Rubin 平台全面投产，面向 Agentic AI 时代

NVIDIA 宣布 Vera Rubin 多机架 pod 级系统已进入全面生产阶段。该系统通过极限协同设计，将五款互联机架规模系统融为一体，包括 Vera Rubin NVL72、Vera CPU 机架、Groq 3 LPX 等组件，专为处理大规模 Agentic AI 工作负载而打造。这标志着 AI 基础设施从单机训练集群向多机协同推理平台的战略转型。

OpenAI 前沿模型登陆 AWS Bedrock

OpenAI 的 frontier 模型和 Codex 现已通过 Amazon Bedrock 向企业提供。企业可在已信任的 AWS 安全合规框架内调用 OpenAI 模型，构建 AI 应用和软件工程工作流。OpenAI 表示这仅是更广泛企业扩张的起点，后续将有更多区域和模型上线。

xAI Composer 2.5

xAI 发布 Composer 2.5，集成 Grok Build

Composer 2.5 是一款快速、高智能模型，在长任务和复杂指令遵循方面表现卓越，现已全面集成到 Grok Build 平台中。

Qwen3.7-Plus 多模态 Agent

阿里发布 Qwen3.7-Plus 多模态 Agent 模型

Qwen3.7-Plus 统一视觉与语言，支持多模态交互混合 Agent，可在 GUI 与 CLI 间无缝切换，适用于编码和生产任务场景。

Cosmos Coalition 成立

Runway 与 NVIDIA 等成立 Cosmos Coalition

Runway 作为创始成员加入 Cosmos Coalition，与 NVIDIA 及多家顶尖 AI 实验室共同构建和开源前沿物理世界模型，推动 Physical AI 发展。

AI 动态速览 06.02

MiniMax · Vercel

M3 登陆 Vercel AI Gateway

MiniMax M3（1M 上下文、多模态输入）现已在 Vercel AI Gateway 可用，首周提供 50% 折扣。

MiniMax · Next.js

M3 在 Next.js Agent 评估中领先开源模型

MiniMax M3 在 Vercel Next.js AI 智能体评估中成为领先的开源模型，仅次于 Opus 和 GPT-5.5，成本仅为 1/10。

发布 Agent 记忆插件 Hy-Memory

Hy-Memory 基于 6 层记忆框架与 System1/System2 双系统，专为长期协作 Agent 设计，提供真正的"第二大脑"能力。

Runway · 欧洲

Runway 设立伦敦欧洲总部

Runway 宣布伦敦为欧洲总部及世界模型研究中心，计划 18 个月内投资 1 亿美元并持续扩展至 2028 年。

Luma 成立开放物理 AI 实验室

Luma 建立开放科学物理 AI 实验室，聚焦解决物理 AI 的泛化问题，推动 AI 从数字领域进入物理世界。

推出 Search as Code 搜索新架构

Perplexity 发布 Search as Code 架构，允许 Agent 直接编写 Python 调用搜索栈，取代逐次函数调用，已默认用于 Computer 模式。

语音黑客松冠军：Agentic OS

语音优先手机操作系统 Agentic OS 获得 OpenAI 语音黑客松最佳人气奖，用户可通过语音与智能体交互操作手机，获得 5 万美元 API 积分。

Claude 重置速率限制并修复子 Agent 问题

Claude 为 Pro 和 Max 用户重置 5 小时与每周速率限制，修复了 Claude Code 中子 Agent 过度并行导致消耗过快的问题。

vLLM 与 RTX Spark 合作推动本地 Agent

vLLM 宣布与 NVIDIA RTX Spark 合作，在 DGX Spark 上本地运行大模型，支持 NVFP4 量化模型。

Runway Aleph 2.0 推出快速蒙版功能

Aleph 2.0 可在数秒内创建合成蒙版，精准隔离视频主体，用于合成、调色或特效处理，大幅简化后期工作流。

Replit：单个 Prompt 即可构建完整商业应用

Replit 推出新功能，用户可从一个提示词生成网站、移动应用、幻灯片和发布视频，并提供 Stripe、QuickBooks 等合作方权益。

「AI Forward Deployed Engineer 正成为硅谷最热门的新职位——工程师直接嵌入客户组织，定制方案、构建和调优 Agent 工作流。」

Andrew Ng

NVIDIA Cosmos 3 统一多模态模型

vLLM-Omni 零日支持 NVIDIA Cosmos 3

vLLM-Omni 提供对 Cosmos 3 的首日支持，该模型融合自回归推理与扩散生成，覆盖文本、图像、视频、音频和机器人动作模态，通过统一的 OpenAI 兼容 API 提供服务。

GrepSeek 搜索智能体架构

GrepSeek：训练搜索智能体直接交互语料

GrepSeek 研究如何训练搜索智能体直接与语料库交互，绕开传统检索管道（retrieval pipeline），实现端到端的语料搜索与推理。

MiniMax M3 登陆 Ollama Cloud

Ollama Cloud 现已支持 MiniMax M3 模型，美国区域运行，零数据留存，可用于 Claude Code 和 Codex 等编码与 Agent 任务。

Step 3.7 Flash 在 kilocode 免费提供

Step 3.7 Flash 在 kilocode 中免费使用，专为编码 Agent 多步编排和可靠工具调用设计。

微软与 NVIDIA 联手将 AI 芯片装入笔记本

Grace 与 Blackwell 芯片进入笔记本形态，微软和 NVIDIA 合作挑战苹果 Silicon 长达六年的统治。

Adobe 与 NVIDIA 合作优化创意工作流

Adobe 在 Photoshop、Premiere 等应用中集成 RTX Spark，AI 渲染与编辑速度提升最高 2 倍。

NVIDIA GTC 台北主题演讲：重新定义 AI 未来

Jensen Huang 在 GTC Taipei 登台，发布 AI 基础设施、自主智能体、物理 AI 与机器人及新一代个人 AI 计算平台。

NVIDIA GTC 亮点回顾

黄仁勋展示全球 AI 工厂基础设施蓝图，涵盖自主 Agent、Physical AI 和机器人技术在多行业落地案例。

MiniMax M3 生态速报首发日集成

M3 登陆 Cloudflare AI Gateway

首发日即上线，1M 上下文、前沿编码、原生多模态，一个 fetch 即可调用。

M3 原生集成 Hermes Agent

发布当日即出现在模型选择器中，由 Nous 团队提供支持。

M3 上线 OpenRouter

发布当天即上线，首周 50% 折扣，1M 上下文 + 前沿编码 + 原生多模态。

草图到可玩游戏仅 $0.028

M3 在 @atomic_chat_hq 上演示了从草稿到可玩游戏的极低成本转换。