OpenAI 基金会成立,初始投入 2.5 亿美元推动 AI 繁荣共享
OpenAI 基金会宣布初始投入 2.5 亿美元,用于经济影响测量、转型支持以及探索实现广泛共享繁荣的新途径,目标是让 AI 提升全球人民的生活质量与个人自由。
OpenAI 基金会宣布初始投入 2.5 亿美元,用于构建安全且充裕的经济未来。这笔资金将投向三个方向:经济影响测量——量化 AI 对就业、收入分配和生产力的具体影响;转型支持——为受 AI 冲击的行业和社区提供再培训与过渡方案;共享繁荣新路径——探索全民基本资本、数据分红等机制,确保 AI 红利不被少数人垄断。基金会表示,AI 有潜力显著提升全球人民的生活质量与个人自由度,但前提是需要有意识地进行制度设计和资源分配,而非寄望于市场自动实现公平。
Google DeepMind 发布 Gemini Embedding 2 原生多模态嵌入模型
Google DeepMind 正式发布了 Gemini Embedding 2 白皮书。这是一个原生的多模态嵌入模型,能够统一处理文本、图像等多种模态的嵌入表示。该模型的推出意味着多模态检索、跨模态对齐和 RAG 系统将获得更强的底层能力支持,无需再为不同模态分别训练独立嵌入模型。
Perplexity 开源推理工具集 pplx-garden,分词器 CPU 利用率降5-6倍
Perplexity AI 开源了其推理技术集合 pplx-garden,包含 RDMA 传输引擎、P2P MoE 分发与组合内核,以及重构的 Unigram 分词器编码器。核心突破在于分词器将 CPU 利用率降低 5–6 倍——这对于 GPU 端推理仅需数毫秒的小型重排序和嵌入模型至关重要,因为此时 CPU 分词已成为延迟的主要瓶颈。
Hardmaru 提出无需端到端反向传播的深度网络块训练方法
研究者发现了一种全新方法,将深度网络分解为独立训练的块,从而避免整个网络同时占用内存。过去十余年来,端到端反向传播一直被视为训练深度网络的唯一路径,但网络全部驻留内存的要求正是 AI 训练撞上资源墙的根本原因。新方法将网络分块后各自独立训练,有望打破当前大模型训练对 GPU 显存规模的刚性约束。
OpenAI 推出安全 MCP 隧道,支持私有 MCP 服务器连接 ChatGPT、Codex
用户可将私有或本地 MCP 服务器部署在内网,通过仅出站 HTTPS 连接至 ChatGPT、Codex 和 Responses API,无需将服务器暴露到公共互联网。
Claude Code 发布可靠性提升更新,响应更快更稳定
Claude Code 团队分享了近期在响应速度和可靠性方面的改进成果,持续优化开发者体验。
Qwen3.5 在 TokenSpeed 引擎实现 580 tps 创纪录推理性能
通义千问 Qwen3.5 在 TokenSpeed 引擎上为代理工作负载达到每秒 580 tokens,创下新纪录。合作方包括 lightseek、NVIDIA、Mooncake 团队和 Tri Dao。
Qwen3.7-Max 在 Code Arena 排名第四,中国实验室最高排名
Qwen3.7-Max 在 Code Arena 排行榜上位列第四,与 Claude Opus 4.6 性能持平,成为中国实验室中排名最高的模型。
OpenAI 将退役 GPT-5.2 和 GPT-5.3-Codex 以简化计算集群
6 月 2 日起,OpenAI 将在 Codex 中停用 GPT-5.2 和 GPT-5.3-Codex 两个模型版本,以精简计算集群管理。
xAI 将 Grok 集成到开源编码平台 Kilo Code,支持代理编程
SuperGrok 和 X Premium+ 用户可在 Kilo Code 中使用 grok-build-0.1 模型,支持高速度与代理编码智能。
M2 系列终结,M3 模型即将推出
MiniMax 宣布 M2 系列结束,下一代 M3 即将到来。
MiniCPM5-1B 端侧大模型发布,Apache 2.0 许可
参数 1B,混合推理能力,同类模型中 SOTA 水平,适用端侧部署。
1-bit 和三元 Bonsai Image 4B 图像生成模型
支持高质量图像生成、模型微调和本地运行。
Creative Agents 创意智能体,赋能全流程创意工作
可规划、生成、迭代和优化创意工作每个阶段。
RF-DETR 实时检测模型登陆 Transformers
实时目标检测与分割模型,性能超越 YOLO,已集成到 Hugging Face Transformers。
Qwen3.7 Max 现已在 Go 中可用,支持 1M 上下文
目前 Qwen 家族最聪明的模型,文本模型,支持百万级上下文窗口。
全注意力机制对抗趋势,MoE 架构详解
Sebastian Raschka 总结了 M2 技术报告:采用全注意力而非滑动窗口、MoE 架构、多项创新训练技巧。
ZoRRo:零冗余 rollout 加速企业级 RL 训练
消除分布式 RL 执行瓶颈,实现大幅加速且无额外开销,成果来自团队近半年研究。
ESMFold2:新一代蛋白质结构预测模型
从单序列预测高精度结构,Yann LeCun 转推,推动 AI 驱动生物学开放科学。
Cambrian-P:融合姿态信息的多模态视频模型
联合建模帧与姿态,将图像序列变为全局一致的空间结构。
AI 基础设施 Modal 完成 3.55 亿美元 C 轮融资
Modal 完成 3.55 亿美元 C 轮融资,用于扩展 AI 原生计算平台,并赞助 DeepSpeed 和 ArcticTraining 的 CI GPU。
Codex 构建自改进税务 Agent,可自动跟踪失败并改进系统
OpenAI 与 Thrive Holdings 合作构建税务代理工作流:审核员修正错误时,Codex 可追踪失败原因、改进系统并在发布前测试变更。
LlamaIndex 发布 LiteParse v2.0:Rust 重写,解析提速 100 倍
完全用 Rust 重写,支持 Rust、JS/TS 和 Python,WASM 包支持浏览器和边缘运行时。
EAGLE 3.1 发布,推进 AI 推理基础设施建设
EAGLE 支持业内多家 AI 基础设施公司,3.1 版本带来新的技术进展。
腾讯混元翻译模型在 Hugging Face 上广受欢迎
腾讯混元最新翻译模型在 Hugging Face 上获得大量关注和下载。
NVIDIA:AI 工厂是新时代基础设施,以 token/瓦特衡量效率
NVIDIA AI 基础设施部门阐述 AI 工厂将能量实时转化为智能,标志着算力基础设施的新范式。
推出 AI 威胁防御网络安全解决方案
综合 AI 驱动的网络安全方案,Sundar Pichai 转发。
Google Drive 文件自动同步功能上线
最热门的功能请求——自动同步 Google Drive 文件——正在逐步推出。
CEO 宣布开源高效分词器,效率远超 HuggingFace
Arav Srinivas:每一毫秒都很重要,开源内部已部署的高效分词器。
在 Replit 中使用 Runway 生成视觉内容
Amjad Masad 确认 Replit 现已支持 Runway 集成。
Demis Hassabis:AI 将加速科学发现
在美国艺术与科学学院撰文讨论 AI 如何加速科学研究。
用户反馈:Grok Build 的 Imagine 功能令人着迷
Elon Musk 转发用户体验:在 Kilo Code 中用 Grok Build 构建应用体验出色。
Grok Build Beta 获大量反馈,团队发现扩容瓶颈
xAI 感谢用户反馈,团队已定位用户报告的使用限制问题区域并正在优化。
JEPA 可识别世界模型证明:学到的潜在空间可被证明
研究团队提出可识别世界模型理论,首次证明 JEPA 学习的是可识别潜在空间。