Meta发布Brain2Qwerty v2:非侵入式脑机接口实现实时句子解码
同日发表Nature Neuroscience论文并发布v2版本,从原始脑电信号直接解码句子,平均单词准确率达61%,标志着脑机接口从实验室走向实用化的关键一步。
Meta在脑机接口领域投下一枚重磅炸弹。研究团队在Nature Neuroscience上正式发表Brain2Qwerty v1论文,并同步发布v2版本。这一定位为端到端非侵入式实时句子解码的pipeline直接从原始脑电信号中解码语言,无需开颅手术,平均单词准确率达到61%。相比v1,v2在解码速度和准确率上均有显著提升,采用先进的脑电图信号处理算法与深度学习模型相结合,为未来的无障碍通信和脑机交互奠定了全新技术基准。
Claude模型登陆Microsoft Foundry,Opus 4.8和Haiku 4.5上线Azure
Anthropic与微软达成重要合作,Claude模型现通过Messages API在Azure上可用,支持提示缓存与思考功能,并运行在NVIDIA GB300 NVL72平台上。
Anthropic旗下顶级模型Claude Opus 4.8和轻量级Claude Haiku 4.5正式登陆Microsoft Foundry,通过Azure云平台向企业客户提供服务。开发者可通过Messages API调用,获得包括提示缓存和深度思考在内的完整能力。NVIDIA方面进一步透露,该服务运行于NVIDIA GB300 NVL72平台,采用Quantum-X800 InfiniBand网络互联,为Agent类AI工作负载提供强大算力支撑。此举是Anthropic扩展企业市场的关键布局,也标志着前沿闭源模型在多云生态中迈向更深层次的融合。
DeepSeek V4将于7月中旬正式发布,引入高峰定价
据消息人士透露,DeepSeek V4正式版定档7月中旬。此前两个月的版本仅为预览版。正式版将引入高峰时段定价机制,基准价格不变但高峰期价格翻倍,以应对预期涌入的巨大需求。随着开源模型不断逼近前沿,DeepSeek的每次迭代都牵动着全球开发者的注意力。
Cursor推出iOS应用,支持云端Agent和远程桌面控制
Cursor for iOS允许用户在任何地方启动云端Agent或远程控制桌面上的代理。Composer 2.5享受75%折扣至7月5日。
编程工具Cursor正式进军移动端。iOS版本让开发者可以从任何地方启动始终在线的云端Agent,或通过手机远程操控运行在桌面上的Agent。这是编程助手从桌面IDE向移动化、云化延伸的重要一步,让开发者摆脱物理位置限制。配合Composer 2.5的75%限时折扣,Cursor正在重新定义随时随地编码的工作方式。
NVIDIA与Palantir合作:Nemotron模型进入安全气隙环境
NVIDIA携手Palantir,将Nemotron开放模型部署到美国政府及关键基础设施的安全气隙环境中。新引擎使团队能在自有基础设施上训练和运行模型,保留数据主权。这一定位面向国防与关键基础设施的部署方案,为开源模型在敏感场景中赋予了新的应用维度。
Tesla FSD v14 Lite 向搭载 AI3 硬件的客户推送,将 HW4 的智能蒸馏到上一代硬件上。
@elonmusk
OpenAI Codex快捷键升级将于7月15日上线
OpenAI宣布Codex快捷键即将迎来重大升级,具体细节将在7月15日揭晓。这一更新将进一步提升开发者在IDE中使用Codex辅助编程的效率与体验。
Vercel AI Gateway上线语音Agent功能
Vercel AI Gateway新增语音Agent能力,支持实时语音对话、语音合成和转写。通过AI SDK 7的useRealtime、generateSpeech和transcribe接口,开发者可以快速构建多模态语音应用代理。
Runway推出Seed Audio 1.0:文本生成语音、音效和音乐
Runway发布Seed Audio 1.0,向所有付费计划用户开放。用户可通过简单文本提示生成长达120秒的动态语音、音效设计和音乐,为视频创作者提供了从画面到声音的一站式AI创作管线。
LlamaIndex发布检索套件Retrieval Harness
LlamaIndex在LlamaParse Index中推出Retrieval Harness,将语义搜索、服务器端grep和文件导航整合到单一Agent推理循环中。单纯语义搜索或暴力grep都无法满足Agent需求,两者结合才能真正提升检索质量。该套件为构建高效RAG系统提供了更完整的工具链。
vLLM社区集成DeepSeek DSpark推测解码
vLLM社区通过PR #46995添加DSpark推测解码支持,兼容DeepSeek-V4 DSpark模型及Qwen3-DSpark模型。该实现采用非因果滑动窗口注意力机制,旨在提升推理吞吐量与内存效率,让开源推理引擎更快一步。
Snowflake开源Arctic RL强化学习后端
Snowflake AI Research团队发布Arctic RL开源项目,这是一个专为企业后训练优化的统一强化学习后端,可显著提升GPU训练性能。Arctic RL已集成VeRL和SkyRL框架,支持通过一个配置标志启用ZoRRo功能,无需修改现有代码。
美团发布V4级别Owl Alpha模型,超5万张AI ASIC训练
美团发布Owl Alpha模型,规模达V4级别,预训练使用超过五万张AI ASIC超级计算节点。模型采用更新版DSA架构和N-gram Embeddings,在多项评测中表现不俗,标志着非传统AI巨头自研大模型进入前沿梯队。
DeepSeek DSpark推测解码单GPU达127 tok/s
分析显示DeepSeek的DSpark推测解码相比DFlash实现20%接受率提升和14%吞吐量提升,单GPU推理速度达到平均127 tok/s,而DFlash为111、EAGLE-3为81。轻量级加提前终止策略展现出明显优势。
SpaceXAI语音API上线Vercel AI Gateway
xAI旗下的SpaceXAI先进语音API现已集成到Vercel AI Gateway中。开发者可通过统一网关获得前沿的语音合成与识别能力,进一步降低了集成多模型语音服务的复杂度。
Spotify工程副总裁:73% PR由AI辅助,每日4500次部署
Spotify副总裁Niklas Gustavsson在与Boris的对话中透露,公司每天进行4500次生产部署,其中73%的拉取请求已由AI辅助完成。这对大型工程组织的AI应用落地具有标杆意义。
阶跃星辰Step 3.7 Flash在Claw-Eval通用Agent排名第二
阶跃星辰的Step 3.7 Flash在自主Agent基准Claw-Eval中排名第二,仅次于Claude Opus 4.6,在长时任务和多步执行鲁棒性上表现优异,为真实场景中的Agent工作负载带来积极信号。
Vercel支持20倍更大的无服务器函数
Vercel将无服务器函数的大小限制提升至原来的20倍,大幅扩展了在边缘运行大型推理逻辑和复杂Agent编排的可能性。
Replit推出桌面应用
Replit Desktop正式发布,支持Windows和Mac双平台,提供无缝多任务处理体验。
PixVerse Seedance 2.0实现原生4K AI视频
PixVerse展示Seedance 2.0模型的4K视频生成能力,专注于电影级角色运动和城市动作场景。
Together AI月处理400万亿tokens
Nathan Lambert透露Together AI每月处理400万亿tokens,展现了推理基础设施的巨大规模。
Fusion Harness:主模型+副模型降本
Graham Neubig提出混合架构,让廉价副模型处理简单任务、主模型处理复杂任务,实现上下文控制并降低LLM调用开销。
AA-Briefcase基准揭示闭源与开源差距
Artificial Analysis发布AA-Briefcase基准评估AI模型在复杂咨询任务中的表现,近期模型快速迭代但闭源与开源差距仍显著。
GLM 5.2性能提升11分接近闭源前沿
GLM 5.2相较5.1提升11分,若保持此进步速度,开源模型将逼近绝对前沿水平。
Claude运行于GB300 NVL72平台
NVIDIA透露Microsoft Foundry上的Claude服务基于NVIDIA GB300 NVL72及Quantum-X800 InfiniBand网络。
NVIDIA发布Nemotron-3-Ultra自托管指南
NVIDIA与vLLM合作发布指南,使用四台DGX Spark自托管550B参数Nemotron-3-Ultra模型。
Clem Delangue:开源AI比闭源安全几个数量级
Hugging Face CEO表示开源AI蓬勃发展,对进步和透明度影响巨大,且比闭源前沿AI危险小得多。