2026年6月30日 · 星期二

Meta发布Brain2Qwerty v2：非侵入式脑机接口实现实时句子解码

同日发表Nature Neuroscience论文并发布v2版本，从原始脑电信号直接解码句子，平均单词准确率达61%，标志着脑机接口从实验室走向实用化的关键一步。

Meta在脑机接口领域投下一枚重磅炸弹。研究团队在Nature Neuroscience上正式发表Brain2Qwerty v1论文，并同步发布v2版本。这一定位为端到端非侵入式实时句子解码的pipeline直接从原始脑电信号中解码语言，无需开颅手术，平均单词准确率达到61%。相比v1，v2在解码速度和准确率上均有显著提升，采用先进的脑电图信号处理算法与深度学习模型相结合，为未来的无障碍通信和脑机交互奠定了全新技术基准。

Claude模型登陆Microsoft Foundry，Opus 4.8和Haiku 4.5上线Azure

Anthropic与微软达成重要合作，Claude模型现通过Messages API在Azure上可用，支持提示缓存与思考功能，并运行在NVIDIA GB300 NVL72平台上。

Anthropic旗下顶级模型Claude Opus 4.8和轻量级Claude Haiku 4.5正式登陆Microsoft Foundry，通过Azure云平台向企业客户提供服务。开发者可通过Messages API调用，获得包括提示缓存和深度思考在内的完整能力。NVIDIA方面进一步透露，该服务运行于NVIDIA GB300 NVL72平台，采用Quantum-X800 InfiniBand网络互联，为Agent类AI工作负载提供强大算力支撑。此举是Anthropic扩展企业市场的关键布局，也标志着前沿闭源模型在多云生态中迈向更深层次的融合。

DeepSeek V4将于7月中旬正式发布，引入高峰定价

据消息人士透露，DeepSeek V4正式版定档7月中旬。此前两个月的版本仅为预览版。正式版将引入高峰时段定价机制，基准价格不变但高峰期价格翻倍，以应对预期涌入的巨大需求。随着开源模型不断逼近前沿，DeepSeek的每次迭代都牵动着全球开发者的注意力。

Cursor推出iOS应用，支持云端Agent和远程桌面控制

Cursor for iOS允许用户在任何地方启动云端Agent或远程控制桌面上的代理。Composer 2.5享受75%折扣至7月5日。

编程工具Cursor正式进军移动端。iOS版本让开发者可以从任何地方启动始终在线的云端Agent，或通过手机远程操控运行在桌面上的Agent。这是编程助手从桌面IDE向移动化、云化延伸的重要一步，让开发者摆脱物理位置限制。配合Composer 2.5的75%限时折扣，Cursor正在重新定义随时随地编码的工作方式。

NVIDIA与Palantir合作：Nemotron模型进入安全气隙环境

NVIDIA携手Palantir，将Nemotron开放模型部署到美国政府及关键基础设施的安全气隙环境中。新引擎使团队能在自有基础设施上训练和运行模型，保留数据主权。这一定位面向国防与关键基础设施的部署方案，为开源模型在敏感场景中赋予了新的应用维度。

Tesla FSD v14 Lite 向搭载 AI3 硬件的客户推送，将 HW4 的智能蒸馏到上一代硬件上。
@elonmusk

OpenAI Codex快捷键升级将于7月15日上线

OpenAI宣布Codex快捷键即将迎来重大升级，具体细节将在7月15日揭晓。这一更新将进一步提升开发者在IDE中使用Codex辅助编程的效率与体验。

Vercel AI Gateway上线语音Agent功能

Vercel AI Gateway新增语音Agent能力，支持实时语音对话、语音合成和转写。通过AI SDK 7的useRealtime、generateSpeech和transcribe接口，开发者可以快速构建多模态语音应用代理。

Runway推出Seed Audio 1.0：文本生成语音、音效和音乐

Runway发布Seed Audio 1.0，向所有付费计划用户开放。用户可通过简单文本提示生成长达120秒的动态语音、音效设计和音乐，为视频创作者提供了从画面到声音的一站式AI创作管线。

LlamaIndex发布检索套件Retrieval Harness

LlamaIndex在LlamaParse Index中推出Retrieval Harness，将语义搜索、服务器端grep和文件导航整合到单一Agent推理循环中。单纯语义搜索或暴力grep都无法满足Agent需求，两者结合才能真正提升检索质量。该套件为构建高效RAG系统提供了更完整的工具链。

vLLM社区集成DeepSeek DSpark推测解码

vLLM社区通过PR #46995添加DSpark推测解码支持，兼容DeepSeek-V4 DSpark模型及Qwen3-DSpark模型。该实现采用非因果滑动窗口注意力机制，旨在提升推理吞吐量与内存效率，让开源推理引擎更快一步。

Snowflake开源Arctic RL强化学习后端

Snowflake AI Research团队发布Arctic RL开源项目，这是一个专为企业后训练优化的统一强化学习后端，可显著提升GPU训练性能。Arctic RL已集成VeRL和SkyRL框架，支持通过一个配置标志启用ZoRRo功能，无需修改现有代码。

美团发布V4级别Owl Alpha模型，超5万张AI ASIC训练

美团发布Owl Alpha模型，规模达V4级别，预训练使用超过五万张AI ASIC超级计算节点。模型采用更新版DSA架构和N-gram Embeddings，在多项评测中表现不俗，标志着非传统AI巨头自研大模型进入前沿梯队。

DeepSeek DSpark推测解码单GPU达127 tok/s

分析显示DeepSeek的DSpark推测解码相比DFlash实现20%接受率提升和14%吞吐量提升，单GPU推理速度达到平均127 tok/s，而DFlash为111、EAGLE-3为81。轻量级加提前终止策略展现出明显优势。

SpaceXAI语音API上线Vercel AI Gateway

xAI旗下的SpaceXAI先进语音API现已集成到Vercel AI Gateway中。开发者可通过统一网关获得前沿的语音合成与识别能力，进一步降低了集成多模型语音服务的复杂度。

Spotify工程副总裁：73% PR由AI辅助，每日4500次部署

Spotify副总裁Niklas Gustavsson在与Boris的对话中透露，公司每天进行4500次生产部署，其中73%的拉取请求已由AI辅助完成。这对大型工程组织的AI应用落地具有标杆意义。

阶跃星辰Step 3.7 Flash在Claw-Eval通用Agent排名第二

阶跃星辰的Step 3.7 Flash在自主Agent基准Claw-Eval中排名第二，仅次于Claude Opus 4.6，在长时任务和多步执行鲁棒性上表现优异，为真实场景中的Agent工作负载带来积极信号。

Vercel支持20倍更大的无服务器函数

Vercel将无服务器函数的大小限制提升至原来的20倍，大幅扩展了在边缘运行大型推理逻辑和复杂Agent编排的可能性。

产品与行业动态06·30

PRODUCT

Replit推出桌面应用

Replit Desktop正式发布，支持Windows和Mac双平台，提供无缝多任务处理体验。

MODEL

PixVerse Seedance 2.0实现原生4K AI视频

PixVerse展示Seedance 2.0模型的4K视频生成能力，专注于电影级角色运动和城市动作场景。

SCALE

Together AI月处理400万亿tokens

Nathan Lambert透露Together AI每月处理400万亿tokens，展现了推理基础设施的巨大规模。

RESEARCH

Fusion Harness：主模型+副模型降本

Graham Neubig提出混合架构，让廉价副模型处理简单任务、主模型处理复杂任务，实现上下文控制并降低LLM调用开销。

基准测试与行业信号06·30

BENCHMARK

AA-Briefcase基准揭示闭源与开源差距

Artificial Analysis发布AA-Briefcase基准评估AI模型在复杂咨询任务中的表现，近期模型快速迭代但闭源与开源差距仍显著。

TREND

GLM 5.2性能提升11分接近闭源前沿

GLM 5.2相较5.1提升11分，若保持此进步速度，开源模型将逼近绝对前沿水平。

INFRA

Claude运行于GB300 NVL72平台

NVIDIA透露Microsoft Foundry上的Claude服务基于NVIDIA GB300 NVL72及Quantum-X800 InfiniBand网络。

GUIDE

NVIDIA发布Nemotron-3-Ultra自托管指南

NVIDIA与vLLM合作发布指南，使用四台DGX Spark自托管550B参数Nemotron-3-Ultra模型。

OPINION

Clem Delangue：开源AI比闭源安全几个数量级

Hugging Face CEO表示开源AI蓬勃发展，对进步和透明度影响巨大，且比闭源前沿AI危险小得多。