Andrej Karpathy宣布加入Anthropic
前Tesla AI总监、OpenAI创始成员加盟Claude团队,称前沿LLM未来几年将非常关键。
Karpathy在个人声明中表示:"我认为接下来几年在前沿LLM领域将特别具有塑造力。我很高兴加入这里的团队并重回研发。我仍然对教育充满热情,并计划适时恢复这方面的工作。"该消息引发行业巨震,推文获得超11.5万赞、8700次转推、近1500万阅读。ClaudeDevs官方发推"Welcome to the team, Andrej!"回应。外界普遍认为Karpathy的加入将为Anthropic带来更多开源贡献,目前Anthropic已在HuggingFace发布包括BioMysteryBench在内的多个数据集。Nato Lambert评论称"为Karpathy高兴,但开放科学领域倍感孤独"。
Pichai:Gemini 3.5 Flash今日可用
在I/O 2026主题演讲中,Pichai宣布Gemini 3.5 Flash即日面向所有用户开放,性能超3.1 Pro,编码进步巨大。
Gemini Omni能推理物理与上下文
Pichai强调Omni不仅能生成逼真场景,更能推理"接下来该发生什么",结合物理直觉与科学文化知识。Hassabis评价其为"世界理解与多模态编辑的飞跃",可处理任何输入生成任何输出,率先从视频起步。即日起向Google AI Plus推送。
Google推出Gemini for Science实验工具
帮助科学家探索假设、验证工作流、解析文献。该工具套件旨在让科研人员更高效地发现新突破,加速科学发现进程。
OpenAI为AI生成图像添加水印与验证工具
OpenAI宣布为AI生成图像新增SynthID水印,并提供公开验证工具,结合已有的C2PA内容凭证体系。此举旨在帮助用户识别AI生成图像并追溯其来源。ChatGPT每周生成超15亿张图片,新措施对内容透明度意义重大。
客户越来越要求容量的确定性。随着模型变得更好,我们预计世界将在相当长一段时间内受到容量约束。我们为1-3年承诺提供打折Token。
—— Sam Altman,OpenAI CEO
Claude计算机操作Agent可靠性指南发布
新博客讲解如何让Claude在真实UI操作中可靠运行,涵盖点击精度、思考努力级别选择、长会话上下文保持、演示录制与回放等关键技术要点。
xAI允许Grok/X Premium在OpenClaw中使用
用户可在开源代理平台OpenClaw上,使用Grok或X Premium订阅进行对话、图像与视频生成,或搜索X平台帖子。
Cohere收购Reliant AI加速企业医疗AI
Cohere在医疗和生物制药领域迈出重要一步,推动主权企业AI落地。
Cursor集成Jira,可分配给Agent
Cursor现可作为Jira工作项,自动读取标题、描述、评论和仓库设置,生成合并就绪PR。
腾讯开源Chronicles-OCR古汉字基准
覆盖3000年汉字演变,7种历史字体,2800张平衡图片,评估视觉大模型对古代文字的理解能力。
OpenAI推出保证计算容量服务
新服务保证客户长期访问OpenAI计算资源,已投资基础设施,提供1-3年承诺期折扣Token。
Claude管理Agent新增安全改进
支持自托管沙箱和MCP隧道,代理执行环境可在用户自有基础设施或托管沙箱中运行。
ChatGPT每周生成超15亿张图片
OpenAI研究员与产品负责人探讨Images 2.0发布以来的新用例与趋势。
Google Flow推出Gemini Omni模型
批处理编辑、角色一致性提升,新增vibe code自定义工作流及移动应用。
Hassabis:Gemini Omni是世界理解飞跃
可处理照片、视频和音频,构建全新场景,支持用户上传视频迭代创意。
ClaudeDevs欢迎Karpathy加入
Karpathy加盟Anthropic引发行业广泛关注,官方发推欢迎。
Karpathy加入或推动Anthropic更多开源
Anthropic已在HuggingFace发布多个数据集,外界期待Karpathy推动更多开源贡献。
Carbon DNA基础模型开源,推理快275倍
3B参数模型匹配Evo2-7B性能,推理速度提升超275倍,在1T token高质量DNA序列上训练。
HuggingFace发布Ettin Reranker家族
6个新CrossEncoder重排序模型,从17M到1B参数,在各尺寸段均达最新水平。
Luma Agents新增Seedance 2.0生成
用户可在原有工作流中直接调用新生成能力,获得更多创作素材。
Anthropic与学者对话探讨AI伦理
与哲学家、神职人员等讨论AI引发的问题,从品格形成入手拓展前沿AI讨论。
联手Blue Yonder推进供应链AI
为全球供应链带来可扩展AI创新。
超级计算机由Gemini驱动
宣称成本降低8倍、速度提升3倍。
Computer减少会议时间90%
12周项目节省120工时。
Browser Use上线iOS
移动端也可使用浏览器操作功能。
为Google Agents API构建模板
使代理能够处理非结构化文档。
Claude Agent集成Vercel Sandbox
每会话运行在全新微虚拟机中。
扩展Antigravity生态系统
帮开发者从调试转向架构设计。
Gemini 3.5 Flash × Antigravity演示
部署多子Agent设计并构建整个城市。
Composer 2.5上线,Musk推荐
Elon Musk发推"Try Composer 2.5 on Cursor!",获逾万赞。
多数人类任务非马尔可夫
fchollet指出最优下一步行动不能仅看当前状态,需压缩追踪历史轨迹。
街景集成Genie世界模型
真实街道环境可在虚拟世界中动态生成,支持机器人与游戏应用。
LongLive-2.0长视频生成
NVFP4并行基础设施专为长视频生成打造。
Rodin Gen-2.5千万面3D生成
全球首个1000万多边形3D GenAI,细化到皮肤微结构。
NanoGPT-Bench检验编码Agent
内部评估套件,测试Agent在AI研发问题上的表现。
MTP支持Qwen3.6家族
本地LLM生态重大里程碑,性能大幅跃升。
Plaid连续扩散语言模型
首次展示扩散模型在标准语言建模上取得有意义的似然值。
免训练扩散采样加速
利用频谱自回归特性,在高噪声阶段仅表示低频。
AutoScientist自动化研究循环
数日内完成完整研究闭环,解决前沿实验室外的训练失败。
开放科学的孤独时刻
Nato Lambert:为Karpathy高兴,但开放科学领域正面临严峻挑战。