巴西市政府员工发现千倍LLM微调加速方法
里约热内卢市政府IT公司的一名员工意外发现了一种比传统方法快1000倍的LLM微调技巧,引发全球AI社区轰动。该方法基于Qwen 7/2架构并添加了SwiR等改进,已在多项基准测试中达成SOTA开源模型水平,甚至超越部分闭源模型。全球南方AI力量的崛起正在改写前沿格局,Frontier labs如临大敌。
里约市政府发布Rio 3.5 Open 397B
里约热内卢市政府IT公司基于Qwen 7/2后训练出Rio 3.5 Open 397B,成为SOTA开源模型,在多项基准上超越同类闭源模型,展现出市政AI创新的巨大潜力。
Zyphra发布ZONOS2实时语音克隆模型
Zyphra AI发布下一代实时TTS模型ZONOS2,支持高保真语音克隆,是业界最先进的语音合成系统,现已全面开源。
阶跃星辰Step 3.7 Flash登陆DeepInfra
Step 3.7 Flash开源多模态推理模型登陆DeepInfra,支持Agent编码、工具使用、搜索和视觉工作流,提供私有端点部署。
AI时代每家公司都需要同时经营两种资本:传统的人力资本,与公司自己构建并拥有的Token资本。人的判断力越强,Token资本的放大效应越大。
— 萨提亚·纳德拉,微软CEO,提出"Token资本"概念
Cohere发布North Mini Code,强调AI主权
Cohere推出North Mini Code模型,联合创始人Nick Frosst在MTSlive上警告专有LLM订阅制的危险,呼吁AI技术应被用户拥有和控制,避免依赖专有API。该模型定位高效代码生成,强调"技术需要主权"。
Replit推出并行Agent,可同时构建多应用
Replit发布全新并行Agent功能,用户可同时运行多个AI Agent来构建网站、移动应用、视频等多种产物,一举告别"一次只造一件事"的时代,大幅提升全栈开发效率。
Kimi发布K2.7-Code编码Agent模型
月之暗面基于Kimi K2.6推出K2.7-Code,专注于编码和Agent任务,采用Coding-focused Agentic架构,现已通过Together AI平台向开发者提供服务。
Pyodide 314.0支持WASM Python扩展包
Pyodide新版本允许将C/C++/Rust等Python扩展编译为WebAssembly并直接发布到PyPI。此前需维护者手动构建托管300多个包,新机制让维护者可像发布原生wheel一样发布WASM wheel,大幅简化浏览器端AI工具链部署。
OpenRouter发布Fusion API,半价达Fable水平
OpenRouter推出Fusion API,通过复合模型路由方法以一半价格达到Fable 5级的智能水平。该API号称市面上最聪明的复合模型,引发行业对模型经济学的重新审视。
Grok Build终端原生渲染数学公式
Grok Build重大更新:终端中可直接原生渲染数学公式和LaTeX表达式。对于需要频繁阅读技术文档和数学表达的工程师而言,这项改进将工作流效率提升了数倍。
AI监管进入动荡新时代
近期事件并非一次性的政策校准,而是AI治理动荡时代的开端。更强大的模型即将到来,可能引发更激烈的政府反应甚至全面禁令,而开源模型缺乏有力的捍卫者。构建开放生态系统刻不容缓。
中国开源模型或面临全面禁令
分析人士警告,若中国开源模型性能大幅跃升,美国国家安全机构可能全面禁止中国LLM模型。对开源权重模型爱好者而言,这将是重大打击。
停止将AI权力集中视为解决方案
Andy Konwinski指出,本周的事件清楚表明,AI权力集中不应被视为解决方案,而应被视作真正的风险。行业需要重新思考治理范式。
Fable被禁后本地AI加速崛起
随着Anthropic的Fable模型被禁,社区加速转向本地模型部署。相关教程、运行工具和指南需求激增,"Fable is banned, long live local AI"成为社区共识。
Clement Delangue:AI没有必然性
HuggingFace CEO指出AI发展没有必然性,存在两条路径:封闭API的权力集中由硅谷和DC少数人决定未来,或者开源AI让所有人参与、拥有、共建。
François Chollet:AI是数字杠杆
AI并非与前几次技术浪潮有本质区别。它是最新形式的数字杠杆,是力量倍增器,但没有方向的力量只是噪音。每一层级仍需人类参与才能产生真正价值。
DeepSeek V4 Pro在Together AI延迟和速度双双夺冠
DeepSeek V4 Pro在Together AI平台上成为延迟和速度双料冠军,全面超越其他模型,再次证明中国开源模型的工程实力。
Gemma 4 12B在HuggingFace下载突破400万
Google Gemma 4 12B模型发布仅一周,在HuggingFace平台下载量突破400万次,一跃成为当下最受欢迎的新模型。
Qwen3.7边缘化,MiniMax M3崛起
Alibaba的Qwen3.7因闭源策略逐渐失去前沿地位,开源模型MiniMax M3正取代其成为新标杆,开源阵营格局悄然洗牌。
DPO严格适当损失函数
ICML 2026接收海报,提出改进偏好优化的严格适当损失函数理论基础。
7个前沿模型AI研究任务基准
研究者对7个前沿模型在ML工程、提示工程等三类自动研究任务上进行基准测试。
通用AI模型胜出专业医疗AI
新论文表明通用大模型在医疗任务上超越专业医疗AI,引发基准方法讨论。
AI模型自训练继承旧习惯
DeepMind发现AI模型训练下一代时,新模型会继承旧模型异常行为。
Open Frontier开放研究工作会议
旧金山举行Open Frontier线下会议,汇集100名开放AI研究者,推动前沿开放。