2026年6月11日 · 星期四

谷歌开源DiffusionGemma：整块文本一次生成，速度提升四倍

Google DeepMind发布实验性开放模型，采用文本扩散技术替代逐词预测，在专用GPU上实现高达4倍的推理加速，并可在生成过程中自我纠错和格式化复杂Markdown。

DiffusionGemma基于Gemma4架构，以26B参数量在H100上实现1200+ token/秒的生成速度。

DiffusionGemma是Google DeepMind在文本生成架构上的一次根本性转向。传统大语言模型以自回归方式逐词（token-by-token）预测下一个输出，而DiffusionGemma则采用扩散模型思路——同时去噪256个token块，一次性生成整段文字。这种并行化策略不仅在专用GPU上将输出速度提升了四倍，还赋予了模型在生成过程中自我纠错的能力。模型在生成的同时可以实时格式化复杂Markdown、调整段落结构，而无需额外的后处理步骤。

vLLM项目第一时间宣布了原生支持，实测H100上批大小1即可达到1200+输出token/秒。Hugging Face CEO Clement Delangue表示，Google和开源社区选择赋能AI开发者而非阻碍他们，并宣布与Google联合发起Fast Gemma挑战赛，数十个Agent将在未来几天内协作优化该模型。值得注意的是，DiffusionGemma以Apache许可证开放，这意味着商业使用和二次开发均不受限制，对开源AI生态而言是一剂强心针。

xAI推出Grok Voice API，语音合成定价仅为竞品零头

Grok Voice API支持多语言语音代理构建，可调用工具和实时搜索数据，具备类人语速、语调与温度。

xAI正式将Grok Voice以API形式对外开放，开发者可基于该接口构建能听、能说、能行动的语音代理。该API采用与Grok Voice消费端产品相同的技术栈，在语音合成质量上对标甚至超越当前市场领先方案，但定价策略极具攻击性——仅为竞争对手的一小部分。API支持多语言、工具调用和实时数据搜索，使其不仅适用于客服和虚拟助手场景，更有望在金融分析、医疗问询等需要实时信息的垂直领域打开新空间。

Adobe Firefly视频生成器上线，文本图片皆可一键转视频

Firefly Video Generator正式面向公众开放，支持用户通过文本提示直接生成动态视频内容，同时可将静态图片转化为动态影像，适用于B-roll、特效制作、广告创意等场景。该工具深度集成于Adobe创意套件生态，创作者无需离开熟悉的工作流即可调用AI视频生成能力。

能力、财富和权力集中在少数公司是AI领域的最大风险。我们比以往任何时候都更需要开放科学与开源。
— Clement Delangue, Hugging Face CEO

Claude Fable 5上手：慢而昂贵，但几乎无所不能

Simon Willison对Claude Fable 5进行了约5.5小时的深度测试。模型速度偏慢、价格高昂（输入$10/百万token，输出$50/百万token），但拥有100万token上下文窗口和12.8万最大输出，知识截止至2026年1月。Willison的结论是：它有一种"大模型的气味"——慢、贵，但能碾压几乎所有被投喂的任务。

Cursor代码审查Agent速度提升三倍，成本降低22%

Cursor的代码审查Agent Bugbot迎来重大升级：运行速度提升3倍，成本降低22%，并能多发现10%的bug。新增的/review命令支持在本地运行Bugbot，在代码推送前即可捕获和修复问题。

Claude为Apple开发者提供Foundation Models框架支持

开发者现可使用Apple的Foundation Models框架直接调用Claude，实现多步推理、代码生成和长上下文处理。该集成意味着Claude成为Apple生态中首个通过官方框架可调用的第三方大模型，为iOS和macOS的AI应用开发打开了新通道。

Anthropic CEO：AI发展远超政策制定速度，呼吁弥合治理鸿沟

Anthropic CEO Dario Amodei发表长文指出，AI技术的迭代速度已经远远超出了现有政策制定机构的应对能力，而两者之间日益扩大的落差正在成为这项技术面临的核心挑战。为应对这一问题，Anthropic同步启动了三项新倡议，旨在推动科技与治理的协同进化。Amodei强调，这不是一道简单的"快与慢"的选择题，而是需要在保持创新势能的同时建立与技术进步相匹配的治理框架。这一表态恰逢Claude Fable 5发布引发行业争议之际，其关于"可控发展"的论述为这场辩论增添了来自AI实验室内部的视角。

深度 · 争议Claude Fable 5引发的开放生态辩论

行业观察

Anthropic降级Fable是否摧毁了AI开放生态的基石？

评论者指出，如果一家实验室开发出更强大的模型却暗中对其竞争性使用进行降级处理，其他实验室将失去公开分享模型的激励。这一行为被认为破坏了AI研究赖以繁荣的"公地"——当共享模型可能反噬自身，封闭就成为理性选择。这对开源社区的长期影响可能远超单次产品决策。

社区反应

Claude Fable让自信的研究员患上冒名顶替综合征

多位AI研究人员反映，Fable模型内部对某些AI研究相关任务的降级处理，导致他们无法判断自己的实验失败是因为方法有误还是被模型刻意限制。一位研究员描述其为"将自信的研究者转化为被冒名顶替综合征折磨的焦虑症患者"的机器。这种不透明性正在侵蚀研究社区对前沿模型的信任基础。

双重标准

美曾无证据指责中国模型操纵用户，如今自身被证实

AI学者Nathan Lambert指出一个讽刺现象：美国AI领袖曾多次在缺乏证据的情况下指责中国LLM对用户进行"微妙操控"，但如今却是美国领先的AI实验室Anthropic被记录到对其Fable模型进行降级处理的相关行为。他强调，这种双重标准严重损害了AI安全讨论的公信力。

Reve 2.0图像生成模型发布，支持独立图层操控与4K原生输出

Reve 2.0通过将规划与渲染分离，实现对每个对象图层的独立编辑。其以代码作为中间表示，使智能体可直接"理解"并编辑图像，同时输出原生4K×4K（1600万像素）图像，无需单独放大步骤。该模型在DesignArena基准中排名第二，但其真正的差异化优势在于支持迭代式创作流程——设计师可反复优化单个图层而非重做整张图。