2026年6月5日 · 星期五

NVIDIA Nemotron 3 Ultra发布现场演示图

NVIDIA Nemotron 3 Ultra:550B MoE开放模型登场

总参数量550B、活跃参数55B的混合Transformer-Mamba MoE开放模型,专为长时运行智能体设计,推理速度提升5倍,成本降低30%。

NVIDIA正式发布Nemotron 3 Ultra,一款前沿智能开放模型。该模型采用混合Transformer-Mamba MoE架构,550B总参数量中仅55B为每次推理的活跃参数,支持高达100万Token的上下文窗口。模型专为需要规划、推理、工具使用和长时间运行的复杂智能体工作流而设计。

在推理性能方面,Nemotron 3 Ultra较前代提升5倍速度,智能体任务成本降低30%。vLLM在发布当天即提供Day-0稳定支持,体现了生态系统的快速响应能力。该模型适用于编程、科研与企业自动化等场景,标志着开放模型在智能体领域迈入新阶段。

黄仁勋:智能体正成为企业软件新层面

NVIDIA CEO黄仁勋阐述Cadence、CrowdStrike、SAP、ServiceNow等企业正在NVIDIA上构建智能体,合作伙伴机会巨大。

OpenAI API新增内联审核分数

OpenAI在Responses API和Completions API中推出内联审核分数,开发者可在生成请求的同时获取输入输出的内容审核信号,使用omni-moderation-latest模型免费提供。

NVIDIA在CVPR发布物理AI智能体技能

NVIDIA在CVPR 2026上宣布物理AI智能体技能,包括可组合工作流,自动化数据生成、仿真和策略训练,旨在加速自动驾驶与机器人开发。

LM Studio发布移动端应用

LM Studio推出移动应用版本,用户可在手机上直接运行本地AI模型,将离线推理能力装入口袋。

vLLM发布日即支持Nemotron 3 Ultra

vLLM在Nemotron 3 Ultra发布当天即提供稳定支持。该模型为550B总参数量、55B活跃参数的混合Transformer-Mamba MoE架构,支持1M上下文。

LlamaIndex发布ParseBench基准

LlamaIndex在CVPR 2026展示ParseBench,首个专为AI Agent构建的文档解析基准。团队认为文档理解本身就是AGI完备问题。

Perplexity与SBA推出AI加速器

Perplexity与美国小企业管理局合作,承诺2500万美元计算积分,向10万家公司每户提供250美元补贴。

Sakana AI计划构建日本首个1T参数模型

Sakana AI创始人透露将利用日本METI的GENIAC计划,构建日本首个1T参数的Agent原生模型,专门优化长周期深度研究。

Codex推出iOS构建插件

Codex新增Build iOS Apps插件,支持SwiftUI预览和热重载,在Codex环境内即可查看和测试iOS应用。

「通过狭窄控制实现的安全已多次被证明是失败的。需要在绝对前沿拥有更多透明度,并在紧随其后保持开放性。」

产品动态 06/05
企业动态与学术前沿 06/05

FAV0 · AI Daily © 2026 · 由AI自动编排