2026年5月23日 · 星期六

Codex新增远程控制Mac功能,锁屏也能用

OpenAI发布Codex计算机使用功能,macOS用户安装插件后,Codex可操控图形界面应用,支持锁屏状态下远程操作。

OpenAI正式推出Codex应用更新,新增计算机使用功能。macOS用户安装插件并授予屏幕录制与辅助功能权限后,Codex即可操控图形界面应用,包括在锁屏状态下远程操作。该功能需单独启用锁屏使用选项,启用后Codex会临时解锁Mac但阻止本地操作,并仅允许经过主动授权的任务运行。该功能适用于检查桌面应用、浏览器操作和复现GUI错误等场景,将Codex的使用边界从命令行终端扩展到整个桌面环境。对于无API接口的传统桌面软件而言,这意味着Agent操控能力的一次重大升级。

模型本身已不再是产品
产品与技术05·23
LLAMA.CPP

llama.cpp新增WebGPU后端支持

llama.cpp迎来完整WebGPU后端,在浏览器中运行大模型成为可能。

ALLEN AI

ArtifactLinker自动预测模型基准表现

新系统可预测模型在哪些基准上表现好,帮助更全面地评估模型能力。

QWEN

Together AI推出Qwen3.7-Max旗舰模型

支持1M上下文,面向Agent时代设计,性能领先。

ADAPTION

AutoScientist两天内达到前沿模型水平

用户可在两天内训练出前沿模型,下月提供免费计算资源。

GLM

GLM-5.1-HighSpeed发布:400 token/s旗舰API

创下旗舰级LLM API速度新标杆,非小模型缩水替代。

DEV TOOLS

Kakuna:通过清单强化代码的Agent

具备技能清单的Agent,自动化代码硬化,支持子Agent并行。

小红书

小红书上线AI Skill上传功能

用户可将自定义AI能力直接发布到平台,被视为重大功能事件。

CLOUDFLARE

CEO专栏:如何用AI决定裁员对象

Cloudflare裁掉1100人并招聘1111名实习生替换,CEO撰文解释决策逻辑。

RESEARCH

现代LLM可无工具计算100位数字乘法

通过CoT缩放即可解决100位乘法,挑战自回归余烬观点。

CLAUDE

Claude Pro计划上线Auto模式,支持Sonnet 4.6

Auto模式扩展至Pro计划,新增对Sonnet 4.6的支持。

DEEPMIND

Project Genie可基于街景创建交互世界

将真实美国地点转换为可交互的虚拟世界,结合Google Maps街景数据。

ARC-AGI-3

ARC-AGI-3挑战赛出现首个跳跃式提升

tufalabs得分从0.68%跃升至1.17%,首次出现有意义的大幅跳升。

行业动态05·23

FAV0 · AI Daily · AI行业每日速览