MiniMax推出Gizmo,双LLM架构消除对话冷场
M2-her即时响应配合M2.7复杂推理,终结AI对话中的尴尬停顿。
MiniMax支持的产品Gizmo正式发布,采用创新的双LLM架构。轻量级M2-her模型负责即时回应,消除对话中的尴尬沉默;强大的M2.7模型则处理复杂推理任务。两套模型协同工作,让AI对话体验更加自然流畅,彻底告别"正在思考中"的漫长等待,为语音AI产品树立了新标杆。
阶跃星辰发布StepAudio 2.5实时语音模型
StepAudio 2.5 Realtime支持实时语音交互,能理解语气、停顿、微情绪等副语言信息,甚至可捕捉句中的半笑声和叹息。API支持自定义角色人格,为语音助手、客服和交互式内容应用带来全新的可能性。
LLMs-from-scratch新增DeepSeek稀疏注意力实现
Sebastian Raschka的开源仓库LLMs-from-scratch新增了DeepSeek稀疏注意力(DSA)的完整从零实现,由读者贡献。该实现包含动机概述和GPT风格模型的参考代码,以独立示例形式提供,便于开发者学习和实验。
Replit Agent与Squidler实现全自动QA闭环
用户用自然语言描述需求,Agent自动构建、测试、修复应用。
Replit Agent结合Squidler测试工具首次实现完整AI开发-测试-修复闭环:用户只需用自然语言描述应用需求,Agent自动编写代码;Squidler模拟真实用户进行测试;发现问题后Agent自动修复。整个QA流程现已在Replit MCP库中可用,标志着AI编码工具从代码生成向全生命周期管理迈出了关键一步。
新论文倡导统一物理学、神经科学与AI的智能科学
Surya Ganguli在Daedalus期刊发表文章,提出整合物理学、神经科学和人工智能建立统一的智能科学。文章从四方面阐述:复杂系统物理学工具分析神经网络学习机制;神经科学揭示生物智能相较AI的多数量级优势;量子硬件与AI协同设计开发新设备;构建大脑数字孪生以研究智能与意识。该框架为跨学科智能研究开辟了新路径。
Gemini Omni视频编辑实现无缝场景替换
用户上传Waymo乘车视频后,利用Gemini Omni将场景从Menlo Park替换为Google Maps截图中的其他地点,过渡效果无缝自然。这一能力展示了Omni在视频理解与编辑融合方面的强大潜力,为视频创作工具带来了全新可能。
DeepSeek-V4-Pro支持百万Token上下文,245TB版本将到来
DeepSeek-V4-Pro允许24,500个实例各承载1M token上下文,未来还将推出245TB规模变体。这需要更好的极端多轮工具支持来充分释放潜力,评论认为目前的上下文压缩技术仍有很大提升空间。
华为推理性能已针对DeepSeek V4优化,新数据中心即将上线
据观察,华为在DeepSeek V4发布后数日内即展示了推理性能,分析认为其后训练阶段已使用华为Ascend芯片。传闻已久的华为AI数据中心预计很快投产,这对国产AI算力生态自主可控意义重大。
谷歌DeepMind扩大与新加坡AI合作
谷歌DeepMind宣布扩大与新加坡的合作伙伴关系,新项目聚焦于安全部署AI、加速科学发现、提升流行病准备和改善医疗保健。合作将由新加坡本地专家共同推进,标志着DeepMind在东南亚AI落地布局的进一步深化。此前新加坡已在AI治理领域走在亚洲前列,此次合作有望加速公共健康与科学研究领域的AI应用落地。
技术容易,资金困难。Anthropic即便架构效率最低,只要持续训练更强的模型、收入不断增长,领先优势就会扩大。最终Opus 5将借鉴DeepSeek论文并实现超越。
— teortaxesTex 评论AI行业竞争格局
CATL和大基金投资DeepSeek释放积极信号
宁德时代(CATL)和国家大基金成为DeepSeek投资方,被认为是重要的产业信号。评论希望政府下一步能切实帮助获取硬件资源,而非仅停留于安全审查层面,以支撑国产大模型的持续竞争力。
DeepSeek V4预览版视觉能力评估:约Qwen 3水平
用户评估DeepSeek视觉能力约在Qwen 3水平,部分接近前沿,但模型集成度不如Claude和Gemini紧凑。鉴于V4当前为"预览版",正式发布时预计集成度和性能将有显著改进。
黄仁勋谈AI助手提升团队效率
黄仁勋分享AI助手如何帮助团队更快行动、更大胆思考,应对曾遥不可及的挑战。
Codex构建并调试iPhone模拟器全流程
gdb展示使用Codex从端到端构建和调试iPhone模拟器的完整过程。
6人团队打造比OpenAI快4-8倍的专用模型
小团队构建的任务特定AI模型速度远超OpenAI和Anthropic,已获50万次下载。
Opus 4.6在复杂代码调试中表现出众
用户发现当其他LLM无法解决代码问题时,调用Opus 4.6往往能成功调试。
用Codex或Claude Code解读Hermes Agent架构
推荐直接用AI工具打开Hermes Agent项目代码库,让AI解释代码结构和文档。
飞书与Claude Code桥接开源项目发布
feishu-claude-code-bridge允许用户在飞书内直接连接Claude Code双向操作。
GPT-5.5 Pro作为事实核查器表现出色
用户测试发现GPT-5.5 Pro能准确核查整章引用,但过于追求细节会返回大量细微差异。
Composer 2.5在游戏开发中的能力测试
用户经过多日测试对Composer 2.5在游戏开发方面的表现有了明确认知。
Codex交互界面:可查看子代理运行详情
用户称赞Codex界面可方便查看当前运行的子代理及每个子代理的任务和提示词。
Qwen3.7 Max API价格下调50%
Qwen3.7 Max API近期提供五折优惠,大模型推理API价格战仍在持续。
MiniMax接入Perplexity搜索基础设施
MiniMax作为开源模型和Agent,现在由Perplexity的搜索基础设施驱动。
Stable Audio 3可在任何计算机上运行
一键启动器使Stable Audio 3无需高性能VRAM即可在任何计算机上运行。
Kling AI在戛纳探讨AI进入电影制作流程
Kling AI在戛纳电影节Marché du Film举办官方会议,聚集全球电影专业人士,探索AI如何进入实际电影制作流程。此次戛纳亮相标志着Kling AI在国际电影行业影响力的显著提升。
Spike Jonze将出席Replit Vibecon大会对谈
这位曾执导《她》(Her)的著名导演将与CEO Amjad Masad同台。
曾执导《她》《成为约翰·马尔科维奇》等影片的奥斯卡获奖导演Spike Jonze,将在Replit的Vibecon大会上与CEO Amjad Masad进行对谈。Jonze以模糊人与机器边界的故事讲述闻名,他的出席为这场AI开发者大会增添了独特的叙事视角。
Omni Flash + Dreams 3D动画展示创意控制
用户展示Google Omni Flash和Dreams 3D动画实现的生成式AI创意控制,速度和灵活性无可比拟。
Omni一键将Waymo旅程改为伦敦场景
用户将Palo Alto的Waymo视频通过提示瞬间转换为威斯敏斯特桥场景,含左行和地标准确。
Runway发布Aleph 2.0视频编辑模型
升级版Aleph 2.0允许精确修改内容同时保持其他部分不变。
Omni视频生成并自动添加字幕
用户先用Omni生成视频,再通过提示"添加字幕"完成编辑。
Luma Agents图形生成工具发布
Luma Agents可将品牌故事转化为图形,帮助建立客户信任和连接。
Kling AI展示梦幻维度视频效果
Kling AI发布Dreamcore风格视频示例,展示AI视频生成的美学能力。
用AI创造现实中不存在的生物形象
Midjourney结合SeeDance 2进行动画实验
Daedalus出版AI与科学特刊
美国艺术与科学院期刊Daedalus发布AI与科学新一期,由James Manyika编辑。
"AI作为正常技术"系列探讨风险应对
系列最新文章讨论AI风险是否需要特殊应对措施,引发学界关注。
MLSys大会主题演讲回顾AI系统演进
Mark Saroufim发表主题演讲,涵盖AI系统演变及强化学习的作用。
变压器学习局限性的心智框架
swyx推荐理解变压器学习能力及局限性的心智模型,提及对抗性世界模型的相关性。
Sakana AI开放多个软件工程师职位
Sakana AI发布招聘信息,涉及研发、应用、产品及平台工程师等岗位。
DeepSeek稳健发展策略受到业内赞赏
评论认为DeepSeek逐步建立信誉、不冒进的策略值得钦佩。
MiniCPM-V 4.6 Hugging Face演示上线
OpenBMB的MiniCPM-V 4.6模型在Hugging Face发布演示demo。
fast-rlm更新:RLM可搜索网页并推荐书籍
递归语言模型(RLM)新版本可通过Exa搜索网页、查看Goodreads并推荐书籍。
创作者是AI创业公司的关键分发渠道
评论指出许多AI创业公司不了解如何有效与创作者合作,但创作者是其关键分发渠道。
Canopy Festival汇聚AI创业公司
Canopy Festival展示了许多充满活力的AI新公司,旧金山的创业者能量独特。
Libramen:Agent经济的基础设施
Libramen项目旨在为代理经济提供基础设施,实现无头服务和一键交易。
Diffusers实现模型性能分析与优化
RisingSayak在Diffusers中开启小型项目,用于跟踪和分析模型性能。