2026年6月25日 · 星期四

OpenAI 推出首款自研 AI 芯片 Jalapeño

与 Broadcom 合作设计并投产,专为 LLM 工作负载优化,将用于 ChatGPT、Codex 和 API 等全线产品

OpenAI 首款自研 AI 芯片 Jalapeño,由 OpenAI 与 Broadcom 联合设计并量产。

OpenAI 正式公布了其首款自研 AI 芯片 Jalapeño。该芯片从架构设计到量产均由 OpenAI 主导,合作伙伴 Broadcom 负责制造环节。Jalapeño 专为大语言模型推理和训练工作负载优化,目前已部署于 ChatGPT、Codex 及 API 后台服务中。OpenAI 表示,芯片是 AI 基础设施的基石,自研芯片意味着对推理延迟、能效比和供应链的更深层掌控。这一举措标志着 OpenAI 在硬件垂直整合上迈出关键一步,业界普遍将其视为与 Google TPU、Amazon Trainium 正面竞争的信号。

Jalapeño 的具体架构细节尚未完全公开,但 OpenAI 透露该芯片在长序列推理场景下能效提升显著,尤其针对未来 Agent 类产品的爆发式调用需求做了前瞻设计。分析人士指出,随着模型能力趋同,推理成本正成为大模型商业化的核心变量,OpenAI 此举有望降低其对英伟达 GPU 的单一依赖。


Kog Laneformer 2B 模型架构示意——以解码延迟为首要指标,采用端到端协同设计。

Kog 开源 2B 模型 Laneformer:推理速度超 3000 tokens/s

采用延迟张量并行(DTP),2.3B 参数在单请求场景下实现超快推理,权重和代码已全量开源至 Hugging Face

Kog 正式开源了 Laneformer 2B 模型,这是一款以解码速度为首要目标的 2.3B 参数模型。其核心创新在于延迟张量并行(DTP)技术,通过在时间维度上隐藏通信开销,大幅提升单请求场景下的推理速度,实测超过 3000 tokens/s。模型经历了约 4T token 预训练、2T token 代码与推理数据持续训练,以及 210M 条指令微调,在编码基准上达到同类规模的竞争力水平。Hugging Face CEO Clement Delangue 称其为「非常酷的工作」,权重和代码均已在 Hugging Face 开源。



Luma 推出 Connectors,接入 Airtable 等外部工具

Luma Connectors 支持接入 Airtable、Dropbox、Google Drive 等外部工具,按需将文件拉取到任意看板中。其 Agent 可在创意工作全流程——规划、生成、迭代和优化——提供全上下文辅助,充当团队力量倍增器。


最复杂的现象,源于简单规则的可扩展组合。无论是星系、芯片还是神经网络,只要找到正确的原始构建块,复杂性会自行处理。

François Chollet

产品与生态 · 速览

AI 使用决策正转变为组织设计问题

Ethan Mollick 指出,组织中如何部署 AI 的决策正从 IT 选项转变为组织设计和战略决策。如何将 Agent 整合进企业?哪些智能应该外包?企业的边界在哪里?人类员工又该扮演什么角色?这些问题不再只是技术选型,而是关乎组织未来形态的核心议题。


短讯速递 · BRIEFS
评测

GLM 5.2 在多基准表现亮眼,但仍有短板

Nathan Lambert 评价 GLM 5.2 在某些基准上表现出色,但存在脆弱的特性,建议根据任务组合使用多个开放模型。

基准

GLM 5.2 ARC-AGI-2 得分 22.8%

GLM 5.2 在 ARC-AGI-2 上达到 22.8%,为最佳中国模型,与 Opus 4.5 相当,但远低于 Grok 4.20 的 65%。

成本

GLM 5.2 CursorBench 成本接近 Opus

Nathan Lambert 指出 GLM 5.2 在 CursorBench 上的成本已接近 Opus 水平,正在压低前沿实验室利润空间。

研究

「柏拉图式表征」论文引发学术讨论

一篇关于柏拉图式表征的论文获得广泛关注,但另一篇相似主题带学术批判的论文却被忽视,研究员认为后者更值得讨论。

技术

DeepSeek 稀疏注意力是否算蒸馏?

研究员半开玩笑地讨论,若在前沿模型架构中使用 DeepSeek 的稀疏注意力技术,是否构成蒸馏。

安全

Claude Tag 功能:好用但企业面临定价风险

Claude 新 Tag 功能非常有用,但其定价模型和锁定风险可能使企业陷入被动的讨价还价。

故障

Claude Code Web 版 GitHub 出口被阻

Simon Willison 报告 Claude Code Web 版显示「GitHub 被出口策略阻止」,严重影响日常工作流。

模型

Fable 5 或将回归并永久纳入订阅

用户推测 Fable 5 模型可能即将回归,并作为订阅的一部分永久可用,但可能需要更严格的身份认证。

方法

极客风格管理 Cursor Skills

用户分享 Cursor Skills 管理方法:只安装在项目内而非全局,以节约上下文空间。

创意

专业动画师用 Seedance 渲染动画

专业动画师使用 Seedance 将 3D 预览渲染成真正动画,保留运动轨迹和镜头控制。

商业

AI 商业化本质为 2Boss 模式

评论指出 AI 商业化进入 2Boss 时代——老板为程序员支付 Codex 费用、为抽卡员支付 Seedance 费用。

方法论

理解复杂系统的最佳方式

François Chollet 认为边缘情况和失败模式定义了系统的轮廓,是理解复杂系统的最佳入口。



更多信号 · MORE SIGNALS

© 2026 FAV0 · AI Daily

MORE·
@huggingface

Kog 开源 2B 模型 Laneformer,推理速度达 3000+ tokens/s

Kog 开源了 2.3B 参数的 Laneformer 模型,采用延迟张量并行(DTP)实现单请求超快推理,已在 Hugging Face 开源权重和代码。

@_akhaliq

Qwen-AgentWorld:面向通用 Agent 的语言世界模型

Akhaliq 分享了 Qwen-AgentWorld,一个原生语言世界模型,能模拟七种 Agent 环境。

@LumaLabsAI

Luma 推出 Connectors 功能,接入 Airtable 等工具

Luma Connectors 支持接入 Airtable、Dropbox、Google Drive 等外部工具,按需将文件拉取到看板中,并配合 Agents 在创意工作全流程提供辅助。

@natolambert

急需的数据集发布

Nathan Lambert 对某个数据集的发布表示兴奋,但未说明具体数据集。

@dotey

Anthropic 与特朗普政府就 Fable 5 模型解禁谈判

据 WIRED 报道,Anthropic 联合创始人 Tom Brown 已取代 Dario Amodei 成为与特朗普政府就 Fable 5 模型解禁谈判的主要代表。

@AravSrinivas

Perplexity Computer 可连接法律研究数据

Perplexity CEO 确认 Computer 功能已支持连接法律研究数据。

@fchollet

Chollet 谈复杂性与基本规则组合

François Chollet 认为最复杂的现象源于简单规则的可扩展组合,找到正确的构建块,复杂性会自行处理。

@poolio

Project Genie 荣获戛纳数字工艺全场大奖

Project Genie 在戛纳国际创意节上获得数字工艺类 Grand Prix 奖项,表彰其用创意释放技术潜力的突破性作品。

@swyx

播客讨论 Databricks 为何击败 Snowflake 等话题

swyx 分享了播客中关于 Databricks 击败 Snowflake、人人都在构建元框架以及 Neon 数据库等深度内容。

@teortaxesTex

Unitree R1 机器人售价 5000 美元,移动能力出色

teortaxesTex 指出 Unitree R1 比 G1 更便宜且更灵活,单臂跳跃表明可安装低功率手爪,将成为机器人研究的有力工具。

@nvidia

Instacart 使用 NVIDIA Jetson 升级智能购物车

Instacart 的 Caper Carts 利用 NVIDIA Jetson 和边缘 AI 在真实超市环境中识别商品。

@PJaccetturo

CapCut 推出 AI 电影节,总奖金 20 万美元

CapCut 宣布举办 AI 电影节,提供 20 万美元奖金,获奖作品将在大型电影节放映。

@emollick

许多人嘴上说不用 AI,实则秘密使用

Ethan Mollick 指出,很多声称从不使用 AI 的人其实在秘密使用。

@dotey

AI 整理播客技巧:同时生成多份稿子并合并

用户分享了自己在让 AI 整理播客访谈时,同时生成 2-3 份稿子并合并以避免遗漏和提升质量的经验。