2026年6月8日 · 星期一

Sakana AI成立RSI Lab，专注递归自我改进

技术飞跃常源于资源约束而非充裕。在AI领域，不应只注重大模型和算力，而应探索能在限制下持续自我改善的开放系统。

Sakana AI宣布成立专注于递归自我改进（Recursive Self-Improvement）的专职研究小组"RSI Lab"。博客指出该实验室基于此前Agent Native Model、AI Scientist等研究积累，致力于构建"模型生成AI科学家，AI科学家再优化模型"的闭环。Sakana AI认为，与其无限堆砌算力，更应关注受限环境下的持续自我优化能力，这或为下一代AI系统提供全新范式。

Figure人形机器人产能提升至每小时一台

Figure公司仅用120天将产量从每天一台提升至每小时一台，增长24倍。

Figure宣布其人形机器人生产速度在过去120天内从每天一台提升至每小时一台。乐观估计2026年可生产数万台，到2027年下半年将开始对美国生产力产生实际影响。评论者指出，这一里程碑标志着人形机器人从实验室走向规模化制造的关键转折，8760台/年的产能已经打开。

"Chat已死"：ChatGPT将转向Agent平台

一位OpenAI高管对《金融时报》直言"Chat is dead"，ChatGPT正筹备自2022年以来最大产品转型。

OpenAI高管在接受《金融时报》采访时表示"Chat已死"。ChatGPT虽不会改名，但产品形态将发生根本性变化：从单纯的聊天工具演进为自主执行任务的Agent平台。这一转型标志着AI产品从对话式交互向任务导向型Agent的范式迁移。

Gemma 4 MTP正式合并入llama.cpp，推理翻倍

llama.cpp通过PR #23398新增对Gemma 4多令牌预测（MTP）支持。MoE版本未见显著加速，但密集模型平均推理速度提升2倍以上。

SK海力士与NVIDIA达成多年技术合作

SK海力士与NVIDIA宣布多年技术合作，共同开发面向全球AI基础设施的下一代内存技术。双方将在HBM及下一代存储架构上联合攻关。

中国芯片突破：逻辑产能绕过HBM瓶颈

消息称中国逻辑芯片产能可满足百万级芯片需求，HBM和中介层瓶颈已被绕过。虽性能有限但可构建合格系统。

"Chat is dead. 聊天已死。"
—— OpenAI高管对《金融时报》

修复grep超时问题

修复web_fetch崩溃

新增自动加载.envrc

深度报道06·08

OpenAI发布数十个AI工作流实例，助力自动化

OpenAI官方发布多套真实世界AI工作流案例，展示团队如何使用AI自动化跨行业任务，涵盖多种场景。

NVIDIA占据Hugging Face热门模型榜首9席

Hugging Face首页30个热门模型中NVIDIA发布了9个，显示美国开源力量强劲回归。

NVIDIA与斗山集团扩大物理AI与机器人合作

NVIDIA与韩国斗山集团宣布扩大在物理AI、机器人及AI工厂基础设施方面的合作。

行业前沿

Vercel AI Gateway月均恢复1万亿Token

Vercel AI Gateway通过智能重试机制每月平均恢复超1万亿Token，且零加成。

论文质疑LLM类人属性，提出零假设检验

该论文以《帝国时代II》训练网络为例，指出任何强大基底都可能呈现类人属性。

本周超25个重大开源模型发布

本周AI开源权重模型发布数量超25个，被称为开源AI最疯狂一周。

OLMo系列或将终止，Nemotron接棒

业内观察：OLMo系列可能结束，NVIDIA Nemotron或成唯一坚持完全开源从零训练的团队。

今年最大代码评估即将发布

swyx预告年度最大代码评估（code eval）即将发布，影响代码生成下一阶段格局。

梁文锋亲自标注V3数据，品味需以身作则

评论称DeepSeek V3的品味来自梁文锋亲自标注数据，对Meta构成利好。

Figure机器人产能展望：2026年或达数万台

评论称Figure机器人产能已达每小时一台，乐观估计2026年可产数万台，2027年起影响生产力。

前沿模型在hard/private/OOD评测上碾压中国/开源

多条hard/private/out-of-distribution评测汇总显示西方前沿模型全面领先，差距并非接近。

HuggingFace每周论文精选

本周热门论文包括PEFT扩展到百万参数模型、全新架构研究等，来自HuggingFace官方推荐。

Super Gemma 4 26B无删减版发布

社区发布Super Gemma 4 26B无审查GGUF v2，零拒绝率，修复工具调用与分词问题。

观点

Anthropic CEO：很少因模型能力不足而不使用Codex

gdb表示不使用Codex时通常因缺少上下文或未编写skill，而非模型能力边界。当前模型能力远超实际使用场景。

Replit总裁预测：AGI将在2028年前到来

Replit总裁Michele Catasta在采访中表示，支持vibe-coding的AGI可能早于2028年出现。

Argus-Retriever：首个后期交互视觉文档检索器

将查询使用与文档表示适应查询的后期交互结合，实现视觉文档检索。

经典模型仅发布权重：AI开源史回顾

AlexNet、Transformer等里程碑模型多未开源代码或权重，ResNet、GPT-2仅发布权重。

Agentic AI产出飙升但采用率持平

数据显示Agentic AI大幅提升产出，但整体采用率并未增长，呈现脱节。

研究论文死亡论：人才流失与市场驱动

研究人员发现不与市场部斗争、直接创业可获巨额融资，导致学术论文输出减少。

产品速递

VLA-JEPA机器人模型正式登陆LeRobot

从视觉特征学习而非仅模仿动作，提升泛化能力。

GPT-5.5设计效果逊于Opus 4.8

用户对比GPT-5.5与Opus 4.8在baoyu-design上的设计效果，Opus 4.8明显更优。

谷歌Omni实现精准视频局部编辑

演示Omni模型对视频进行目标编辑，如将青蛙变为小猫而背景不变。

LLM或导致白领过剩，蓝领反而稀缺

评论认为LLM将导致办公室工作者过剩，而机器人仍昂贵且稀缺。

多个新基准测试发布

包括SWE-Marathon、DeepSWE、ExploitBench、GBA-Eval等新基准。

定制芯片是竞争资金还是AGI必经之路？

评论认为定制芯片不仅为AGI准备，也是与NVIDIA竞争融资的策略。

AI算力容量预测：2030年16GW？

评论对各大国2030年AI容量预测存疑，认为现有数据差异巨大。

DeepSeek 384集群可并行RL教师克隆

384集群可并行强化学习，教师克隆后合并，V5报告值得期待。

MiniMax M3与Speech模型亮相Y Combinator

MiniMax的M3模型和Speech-2.8在Y Combinator对话式语音黑客马拉松中被使用。

工具与生态

Reachy mini机器人实现本地实时运行

通过本地推理实现近实时响应，新版本v1.8.0支持MCP扩展。

Ideogram 4.0与Lovart合作推出新功能

联合发布AI图像生成新功能。

Replit CEO强调聚焦市场、减少分心

平台致力于消除干扰，让开发者专注于快速上市和盈利。

Claude Design开发模式：先设计后编码

用户分享成功流程：先用Claude Design设计UI/UX，生成原型后再开发App。

短讯

Deep Research对比：ChatGPT最佳

Cursor集成浏览器变设计工作室

AI让好点子实现成本极低

AI安全专家：我们对模型所知甚少

Omni Flash与Dreams 3D结合惊艳

HF模型后训练与推送流程获好评

开发者自制工具解密Claude Design请求

Claude Design产品设计8条黄金法则

太空GPU：技术资本新巅峰

AI循环自动化：编写循环而非提示