Google DeepMind推出AlphaProof Nexus代理框架
利用AI代理推进研究级别数学问题解决,标志AI数学推理重要进展。
Google DeepMind发布AlphaProof Nexus,一种全新的agentic框架。该框架调度多个AI代理协同工作,在复杂数学定理证明与开放性问题求解上取得突破性进展,被认为是AI在科学研究自动化道路上的又一里程碑。
xAI推出Grok Build Beta,支持Plan Mode与自动化编排

Grok Build Beta现已面向SuperGrok和X Premium+用户开放,新增原生子代理视图、Plan Mode集成、鼠标支持及全屏终端UI。用户可通过Plan Mode规划复杂任务,用Imagine生成图像与视频,利用CLI构建自动化流程或编排器,开发者生态逐步成型。
MiniCPM5-1B完全开源,登顶1B参数模型榜单
MiniCPM5-1B模型实现完全开源,完整公开权重、训练数据和部署代码。在人工评测榜单上,该1B参数模型排名第一,为小参数模型树立了新标杆。
Replit发布AI Agent 4平台,自然语言生成应用
Replit推出AI Agent 4,用户仅需用自然语言描述即可生成应用、网站和移动端产品。Agent 4支持并行任务执行和团队实时协作,内置认证、数据库、托管、监控等全栈基础设施,并可集成OpenAI、Stripe等100多项服务,同时提供SSO、SOC 2等企业级安全控制。平台面向个人开发者和企业团队,Databricks、Zillow等公司已在使用。
Grok Build还将公测约一个月,但在生产任务中已相当有用。
— Elon Musk
Kimi K2.6开源模型登顶3D设计排行榜
Kimi K2.6在Design Arena的3D设计排行榜上重返第一,开源模型在3D生成领域取得领先地位。
Hugging Face发布开源人形机器人LeRobotHF
Hugging Face推出LeRobotHF,一套完整开源的人形机器人硬件与软件系统,材料成本仅约2500美元,包含全套组装指南与开发者工具链。
LongCat发布开源视频模型,Hugging Face免费可用
LongCat开源视频模型现已上线Hugging Face且免费可用,据测试者反馈生成效果惊艳,为开源视频生成领域注入新活力。
JEPA-WM论文被TMLR接收并获可复现认证
Yann LeCun团队的JEPA-WM世界模型研究论文被TMLR正式接收,同时获得可复现性认证徽章,新版本已发布在arXiv。
Qwen3.7-Max默认启用隐式缓存加速降本
Qwen3.7-Max现默认开启隐式缓存,无需额外配置即可自动提升响应速度并降低调用成本。对于需要更高确定性命中率的场景,可通过请求标记使用显式缓存。
MiMo V2.5-Coder本地运行需128GB RAM
MiMo V2.5-Coder编码模型发布,要求128GB RAM,被评价为可在本地运行的最佳编码模型之一,兼具速度与质量。
NayanaOCR开源语料库覆盖22种语言
NayanaOCR Corpus发布,是目前最大的开源合成多语言OCR数据集,包含超百万张文档图像,覆盖22种语言文字。
PhysX-Omni首个统一物理模拟生成框架
PhysX-Omni是首个面向Physical AI的统一模拟就绪生成框架,同时支持刚体、可变形体与软体物理,为机器人训练提供新工具。
τ-Scaling:Nvidia信号处理超摩尔增益
τ-Scaling概念解读Nvidia在信号处理速度上的超摩尔定律增益,涉及Rubin Ultra等下一代芯片性能预测,是理解AI算力增长的关键框架。
2030年单超算可达1 Zettaflops
分析预测基于Nvidia Rubin Ultra NVL576架构,单超算POD到2030年可达1 Zettaflops算力,届时约需4至5万颗2027代芯片。
Ascend推出HyperParallel-MoE调度系统
华为Ascend A3芯片推出专用MoE训练调度系统HyperParallel-MoE,针对Ascend的矩阵单元和向量单元深度优化。
DeepMind数学系统再解8题引AGI讨论
评论指出Google DeepMind数学系统又解决8个新问题,若这还不算迈向AGI,可能需要重新定义术语了。
HF Reachy Mini桌面机器人支持Agentic编程
Reachy Mini桌面机器人组装仅需3小时,IDE与开发者生态成熟,支持Agentic编程,10岁以下儿童配合Codex即可扩展功能。
Luma Agents全程规划生成创意内容
Luma Agents专注创意工作流,可全程规划、生成、迭代并完善内容,在创意各阶段保持完整上下文,成为团队生产力倍增器。
亮相戛纳,动画导演赞AI纹理捕捉超预期
《姜子牙》导演在戛纳电影节表示Kling AI捕捉纹理的效果完全超出动画师预期,自己正学习与AI协作创作。
Aleph 2.0通用文本编辑模型支持视觉提示
Aleph 2.0发布,作为通用文本编辑模型新版本,引入视觉提示功能实现精准编辑操作。
CEO研究编码助手对HF产品提及情况
Clement Delangue正通过大量查询并使用AI代理分析,研究Claude Code、Codex等编码助手如何提及Hugging Face产品。
AutoScientist自动化科学平台Beta开放
Adaption AI的AutoScientist自动化科学平台已开放Beta测试,目标是用AI代理加速科学实验流程。
Sakana AI参与日本首相官邸座谈讨论行业AI应用
Sakana AI在首相官邸车座对话中介绍了金融等行业AI实施案例,强调日本需发展自主AI技术以维护数据主权。
解读AI新热词:On-policy蒸馏技术
On-policy蒸馏是当前AI热门后训练技术,学生模型复制教师模型的输出分布以实现能力迁移,正成为模型优化新范式。
ax-agent新增PEEK模块可包装任意DSPy Agent
Ax Agent新增PEEK模块,可包装任何DSPy Agent以提升性能。Ax是TypeScript版DSPy框架,支持OpenAI、Anthropic、Gemini等15+提供商。
GEPA不止提示优化,更是高效超参数搜索算法
社区反馈GEPA不仅是提示优化算法,实际上是目前最高效的超参数搜索算法之一,应用前景广阔。
Percy Liang团队新方法:训练前即可预测模型性能
Percy Liang团队提出了一种方法,可以在实际开始训练之前预测模型是否会表现良好,有望大幅降低大模型研发的试错成本。相关论文已正式发表。