2026年5月28日 · 星期四

OpenAI 基金会成立，初始投入 2.5 亿美元推动 AI 繁荣共享

OpenAI 基金会宣布初始投入 2.5 亿美元，用于经济影响测量、转型支持以及探索实现广泛共享繁荣的新途径，目标是让 AI 提升全球人民的生活质量与个人自由。

OpenAI · Sam Altman

OpenAI 基金会宣布初始投入 2.5 亿美元，用于构建安全且充裕的经济未来。这笔资金将投向三个方向：经济影响测量——量化 AI 对就业、收入分配和生产力的具体影响；转型支持——为受 AI 冲击的行业和社区提供再培训与过渡方案；共享繁荣新路径——探索全民基本资本、数据分红等机制，确保 AI 红利不被少数人垄断。基金会表示，AI 有潜力显著提升全球人民的生活质量与个人自由度，但前提是需要有意识地进行制度设计和资源分配，而非寄望于市场自动实现公平。

Google DeepMind 发布 Gemini Embedding 2 原生多模态嵌入模型

Google DeepMind 正式发布了 Gemini Embedding 2 白皮书。这是一个原生的多模态嵌入模型，能够统一处理文本、图像等多种模态的嵌入表示。该模型的推出意味着多模态检索、跨模态对齐和 RAG 系统将获得更强的底层能力支持，无需再为不同模态分别训练独立嵌入模型。

Perplexity AI 开源推理技术集合 pplx-garden

Perplexity 开源推理工具集 pplx-garden，分词器 CPU 利用率降5-6倍

Perplexity AI 开源了其推理技术集合 pplx-garden，包含 RDMA 传输引擎、P2P MoE 分发与组合内核，以及重构的 Unigram 分词器编码器。核心突破在于分词器将 CPU 利用率降低 5–6 倍——这对于 GPU 端推理仅需数毫秒的小型重排序和嵌入模型至关重要，因为此时 CPU 分词已成为延迟的主要瓶颈。

Runway 现可通过 MCP 直接接入主流 AI 开发工具

Runway 推出 MCP 接入，在 Claude、ChatGPT 等工具中直接生成图像视频

Runway MCP 让用户无需离开日常工作环境即可调用 Gen-4.5、Seedance 2.0、GPT Images 2.0、Kling 等先进模型。

Runway 正式发布 MCP 接入能力，用户现可在 Claude、ChatGPT、Cursor、Replit 等常用工具中直接调用 Runway 旗下的 Gen-4.5、Seedance 2.0 等模型生成图像和视频。这意味着创意工作者不再需要在多个平台之间切换——只需在熟悉的对话界面或 IDE 中提出需求，Runway 即可在后台完成视觉内容生成。

Hardmaru 提出无需端到端反向传播的深度网络块训练方法

研究者发现了一种全新方法，将深度网络分解为独立训练的块，从而避免整个网络同时占用内存。过去十余年来，端到端反向传播一直被视为训练深度网络的唯一路径，但网络全部驻留内存的要求正是 AI 训练撞上资源墙的根本原因。新方法将网络分块后各自独立训练，有望打破当前大模型训练对 GPU 显存规模的刚性约束。

OpenAI 推出安全 MCP 隧道，支持私有 MCP 服务器连接 ChatGPT、Codex

用户可将私有或本地 MCP 服务器部署在内网，通过仅出站 HTTPS 连接至 ChatGPT、Codex 和 Responses API，无需将服务器暴露到公共互联网。

Claude Code 发布可靠性提升更新，响应更快更稳定

Claude Code 团队分享了近期在响应速度和可靠性方面的改进成果，持续优化开发者体验。

Qwen3.5 在 TokenSpeed 引擎实现 580 tps 创纪录推理性能

通义千问 Qwen3.5 在 TokenSpeed 引擎上为代理工作负载达到每秒 580 tokens，创下新纪录。合作方包括 lightseek、NVIDIA、Mooncake 团队和 Tri Dao。

Qwen3.7-Max 在 Code Arena 排名第四，中国实验室最高排名

Qwen3.7-Max 在 Code Arena 排行榜上位列第四，与 Claude Opus 4.6 性能持平，成为中国实验室中排名最高的模型。

OpenAI 将退役 GPT-5.2 和 GPT-5.3-Codex 以简化计算集群

6 月 2 日起，OpenAI 将在 Codex 中停用 GPT-5.2 和 GPT-5.3-Codex 两个模型版本，以精简计算集群管理。

xAI 将 Grok 集成到开源编码平台 Kilo Code，支持代理编程

SuperGrok 和 X Premium+ 用户可在 Kilo Code 中使用 grok-build-0.1 模型，支持高速度与代理编码智能。

模型发布05·28

M2 系列终结，M3 模型即将推出

MiniMax 宣布 M2 系列结束，下一代 M3 即将到来。

MiniCPM5-1B 端侧大模型发布，Apache 2.0 许可

参数 1B，混合推理能力，同类模型中 SOTA 水平，适用端侧部署。

1-bit 和三元 Bonsai Image 4B 图像生成模型

支持高质量图像生成、模型微调和本地运行。

Creative Agents 创意智能体，赋能全流程创意工作

可规划、生成、迭代和优化创意工作每个阶段。

RF-DETR 实时检测模型登陆 Transformers

实时目标检测与分割模型，性能超越 YOLO，已集成到 Hugging Face Transformers。

Qwen3.7 Max 现已在 Go 中可用，支持 1M 上下文

目前 Qwen 家族最聪明的模型，文本模型，支持百万级上下文窗口。

研究与基础设施05·28

MiniMax M2 报告

全注意力机制对抗趋势，MoE 架构详解

Sebastian Raschka 总结了 M2 技术报告：采用全注意力而非滑动窗口、MoE 架构、多项创新训练技巧。

ZoRRo：零冗余 rollout 加速企业级 RL 训练

消除分布式 RL 执行瓶颈，实现大幅加速且无额外开销，成果来自团队近半年研究。

EvolutionaryScale

ESMFold2：新一代蛋白质结构预测模型

从单序列预测高精度结构，Yann LeCun 转推，推动 AI 驱动生物学开放科学。

Saining Xie 团队

Cambrian-P：融合姿态信息的多模态视频模型

联合建模帧与姿态，将图像序列变为全局一致的空间结构。

AI 基础设施 Modal 完成 3.55 亿美元 C 轮融资

Modal 完成 3.55 亿美元 C 轮融资，用于扩展 AI 原生计算平台，并赞助 DeepSpeed 和 ArcticTraining 的 CI GPU。

Codex 构建自改进税务 Agent，可自动跟踪失败并改进系统

OpenAI 与 Thrive Holdings 合作构建税务代理工作流：审核员修正错误时，Codex 可追踪失败原因、改进系统并在发布前测试变更。

LlamaIndex 发布 LiteParse v2.0：Rust 重写，解析提速 100 倍

完全用 Rust 重写，支持 Rust、JS/TS 和 Python，WASM 包支持浏览器和边缘运行时。

EAGLE 3.1 发布，推进 AI 推理基础设施建设

EAGLE 支持业内多家 AI 基础设施公司，3.1 版本带来新的技术进展。

腾讯混元翻译模型在 Hugging Face 上广受欢迎

腾讯混元最新翻译模型在 Hugging Face 上获得大量关注和下载。

NVIDIA：AI 工厂是新时代基础设施，以 token/瓦特衡量效率

NVIDIA AI 基础设施部门阐述 AI 工厂将能量实时转化为智能，标志着算力基础设施的新范式。

产品与行业动态

推出 AI 威胁防御网络安全解决方案

综合 AI 驱动的网络安全方案，Sundar Pichai 转发。

Google Drive 文件自动同步功能上线

最热门的功能请求——自动同步 Google Drive 文件——正在逐步推出。

CEO 宣布开源高效分词器，效率远超 HuggingFace

Arav Srinivas：每一毫秒都很重要，开源内部已部署的高效分词器。

在 Replit 中使用 Runway 生成视觉内容

Amjad Masad 确认 Replit 现已支持 Runway 集成。

Demis Hassabis：AI 将加速科学发现

在美国艺术与科学学院撰文讨论 AI 如何加速科学研究。

用户反馈：Grok Build 的 Imagine 功能令人着迷

Elon Musk 转发用户体验：在 Kilo Code 中用 Grok Build 构建应用体验出色。

Grok Build Beta 获大量反馈，团队发现扩容瓶颈

xAI 感谢用户反馈，团队已定位用户报告的使用限制问题区域并正在优化。

JEPA 可识别世界模型证明：学到的潜在空间可被证明

研究团队提出可识别世界模型理论，首次证明 JEPA 学习的是可识别潜在空间。