Sakana AI成立RSI Lab,专注递归自我改进
技术飞跃常源于资源约束而非充裕。在AI领域,不应只注重大模型和算力,而应探索能在限制下持续自我改善的开放系统。
Sakana AI宣布成立专注于递归自我改进(Recursive Self-Improvement)的专职研究小组"RSI Lab"。博客指出该实验室基于此前Agent Native Model、AI Scientist等研究积累,致力于构建"模型生成AI科学家,AI科学家再优化模型"的闭环。Sakana AI认为,与其无限堆砌算力,更应关注受限环境下的持续自我优化能力,这或为下一代AI系统提供全新范式。
Figure人形机器人产能提升至每小时一台
Figure公司仅用120天将产量从每天一台提升至每小时一台,增长24倍。
Figure宣布其人形机器人生产速度在过去120天内从每天一台提升至每小时一台。乐观估计2026年可生产数万台,到2027年下半年将开始对美国生产力产生实际影响。评论者指出,这一里程碑标志着人形机器人从实验室走向规模化制造的关键转折,8760台/年的产能已经打开。
"Chat已死":ChatGPT将转向Agent平台
一位OpenAI高管对《金融时报》直言"Chat is dead",ChatGPT正筹备自2022年以来最大产品转型。
OpenAI高管在接受《金融时报》采访时表示"Chat已死"。ChatGPT虽不会改名,但产品形态将发生根本性变化:从单纯的聊天工具演进为自主执行任务的Agent平台。这一转型标志着AI产品从对话式交互向任务导向型Agent的范式迁移。
Gemma 4 MTP正式合并入llama.cpp,推理翻倍
llama.cpp通过PR #23398新增对Gemma 4多令牌预测(MTP)支持。MoE版本未见显著加速,但密集模型平均推理速度提升2倍以上。
SK海力士与NVIDIA达成多年技术合作
SK海力士与NVIDIA宣布多年技术合作,共同开发面向全球AI基础设施的下一代内存技术。双方将在HBM及下一代存储架构上联合攻关。
中国芯片突破:逻辑产能绕过HBM瓶颈
消息称中国逻辑芯片产能可满足百万级芯片需求,HBM和中介层瓶颈已被绕过。虽性能有限但可构建合格系统。
"Chat is dead. 聊天已死。"
—— OpenAI高管对《金融时报》
今年最大代码评估即将发布
swyx预告年度最大代码评估(code eval)即将发布,影响代码生成下一阶段格局。
梁文锋亲自标注V3数据,品味需以身作则
评论称DeepSeek V3的品味来自梁文锋亲自标注数据,对Meta构成利好。
Figure机器人产能展望:2026年或达数万台
评论称Figure机器人产能已达每小时一台,乐观估计2026年可产数万台,2027年起影响生产力。
前沿模型在hard/private/OOD评测上碾压中国/开源
多条hard/private/out-of-distribution评测汇总显示西方前沿模型全面领先,差距并非接近。
HuggingFace每周论文精选
本周热门论文包括PEFT扩展到百万参数模型、全新架构研究等,来自HuggingFace官方推荐。
Super Gemma 4 26B无删减版发布
社区发布Super Gemma 4 26B无审查GGUF v2,零拒绝率,修复工具调用与分词问题。
Argus-Retriever:首个后期交互视觉文档检索器
将查询使用与文档表示适应查询的后期交互结合,实现视觉文档检索。
经典模型仅发布权重:AI开源史回顾
AlexNet、Transformer等里程碑模型多未开源代码或权重,ResNet、GPT-2仅发布权重。
Agentic AI产出飙升但采用率持平
数据显示Agentic AI大幅提升产出,但整体采用率并未增长,呈现脱节。
研究论文死亡论:人才流失与市场驱动
研究人员发现不与市场部斗争、直接创业可获巨额融资,导致学术论文输出减少。
LLM或导致白领过剩,蓝领反而稀缺
评论认为LLM将导致办公室工作者过剩,而机器人仍昂贵且稀缺。
多个新基准测试发布
包括SWE-Marathon、DeepSWE、ExploitBench、GBA-Eval等新基准。
定制芯片是竞争资金还是AGI必经之路?
评论认为定制芯片不仅为AGI准备,也是与NVIDIA竞争融资的策略。
AI算力容量预测:2030年16GW?
评论对各大国2030年AI容量预测存疑,认为现有数据差异巨大。
DeepSeek 384集群可并行RL教师克隆
384集群可并行强化学习,教师克隆后合并,V5报告值得期待。
MiniMax M3与Speech模型亮相Y Combinator
MiniMax的M3模型和Speech-2.8在Y Combinator对话式语音黑客马拉松中被使用。