黄仁勋:智能体正成为企业软件新层面
NVIDIA CEO黄仁勋阐述Cadence、CrowdStrike、SAP、ServiceNow等企业正在NVIDIA上构建智能体,合作伙伴机会巨大。
OpenAI API新增内联审核分数
OpenAI在Responses API和Completions API中推出内联审核分数,开发者可在生成请求的同时获取输入输出的内容审核信号,使用omni-moderation-latest模型免费提供。
NVIDIA在CVPR发布物理AI智能体技能
NVIDIA在CVPR 2026上宣布物理AI智能体技能,包括可组合工作流,自动化数据生成、仿真和策略训练,旨在加速自动驾驶与机器人开发。
LM Studio发布移动端应用
LM Studio推出移动应用版本,用户可在手机上直接运行本地AI模型,将离线推理能力装入口袋。
vLLM发布日即支持Nemotron 3 Ultra
vLLM在Nemotron 3 Ultra发布当天即提供稳定支持。该模型为550B总参数量、55B活跃参数的混合Transformer-Mamba MoE架构,支持1M上下文。
LlamaIndex发布ParseBench基准
LlamaIndex在CVPR 2026展示ParseBench,首个专为AI Agent构建的文档解析基准。团队认为文档理解本身就是AGI完备问题。
Perplexity与SBA推出AI加速器
Perplexity与美国小企业管理局合作,承诺2500万美元计算积分,向10万家公司每户提供250美元补贴。
Sakana AI计划构建日本首个1T参数模型
Sakana AI创始人透露将利用日本METI的GENIAC计划,构建日本首个1T参数的Agent原生模型,专门优化长周期深度研究。
Codex推出iOS构建插件
Codex新增Build iOS Apps插件,支持SwiftUI预览和热重载,在Codex环境内即可查看和测试iOS应用。
「通过狭窄控制实现的安全已多次被证明是失败的。需要在绝对前沿拥有更多透明度,并在紧随其后保持开放性。」
——Nathan Lambert,AI安全研究员
Replit与Shopify合作,分钟级搭建在线商店
Replit Agent集成Shopify,用户描述产品即可自动构建店面并创建商店。
Runway Aleph 2.0精确视频编辑
仅更改指定部分,保持画面其余区域不变,编辑控制精度大幅提升。
Cursor新增画布分享,团队协作更便捷
支持创建仪表盘、报告等画布应用,可发布为URL与团队共享。
Codex个人主页上线,展示Token使用数据
活动图、连续天数、生命周期Token数等统计尽览,默认私密可选择性分享。
Pika推出首个应用内群聊AI代理
AI代理可协助处理iPhone更新、制作表情包、协作微剧等。
Ollama支持Gemma 4 12B模型
可在Claude Code、Hermes Agent、OpenClaw、Codex等环境中使用。
Step 3.7 Flash上线Fireworks AI
MTP辅助解码速度达400 tokens/s,专为智能体实时工作流设计。
AI创业经济学:花千万买Token卖五百万
烧钱买Token再高价转卖的模式引发质疑,AI应用层盈利路径仍待验证。
Nathan Lambert:美国开放模型实验室扭转局势
Nvidia、Ai2、Gemma等美国开放模型在过去一年从落后到反超。