MiniMax将参加AWS Builder Loft展示M3及Sparse Attention
MiniMax将于6月9日在旧金山AWS Builder Loft展示M3模型,包括其稀疏注意力架构和100万token上下文窗口。
Gemma 4 QAT:3倍内存节省近乎原始性能
Google发布Gemma 4的量化感知训练版本,可在3倍减少内存的情况下保持接近原始性能,大幅降低部署门槛。
VLA-JEPA:预测表示学习的机器人基础模型
LeRobot发布VLA-JEPA模型,通过学习预测未来状态表示而非直接学习动作映射,显著提升机器人的泛化能力。
Ideogram 4.0架构详解:Qwen3-VL编码器+DiT
Ideogram 4.0包含冻结的Qwen3-VL-8B文本编码器、34层单流DiT和流匹配等组件,架构透明度引发社区讨论。
Scaling knowledge gives you static competence. Intelligence gives you adaptability.
— François Chollet
MiniMax M3与Opus在bug检测中表现相当
MiniMax M3和Opus在17个bug中均捕获13个,成本分别为0.07和3.39美元。
本周开源AI模型密集发布超25个
本周开源AI领域迎来疯狂发布周,超过25个显着的开源权重模型集中发布。
LM Studio MLX引擎新版本显著提速
LM Studio的MLX引擎在最新版本中大幅提升速度,技术细节可参见深度分析文章。
PixVerse推出VibeMV:AI音乐视频生成器
PixVerse的VibeMV MiniApps支持音频同步、角色风格化与字幕预设,用户上传音频等即可生成音乐视频。
Replit与Shopify达成合作
Replit宣布与Shopify合作,两家公司联手探索AI驱动的电商开发新范式。
Neuralink植入者20年后恢复绘画能力
20年没有握笔的Audrey Crews通过Neuralink脑机接口重新开始绘画,BCI技术再迎里程碑。
Nathan Lambert:Agent无法解决模型构建的主要瓶颈
Nathan Lambert坚持认为尽管有Anthropic的乐观,但组织、计算、数据访问等瓶颈仍需多年线性改进。
NVIDIA发布Anchor Lab机器人数据集
NVIDIA在Hugging Face上发布了Anchor Lab数据集,提供真实世界机器人测量数据以校准仿真。
论文讨论:Token级熵不能全面衡量RL训练健康度
一篇论文认为token级熵只衡量单响应内的多样性,不能全面评估RL训练,可能误导。
Simon Willison发布MicroPython沙盒方案
通过将MicroPython编译为WebAssembly,实现了安全的Python沙盒执行环境,用于AI插件系统。
Ethan Mollick:Gemini Pro迭代缓慢致性能差距扩大
Google的Gemini Pro模型自2月以来未更新,与Claude和GPT的性能差距日益明显。
Anthropic的Agent团队与工作流对比图解析
Ethan Mollick分享Anthropic的图表,说明Agent Team和Workflow都是强大但token消耗大的方法。
分析:中国到2027年可年化部署24GW AI算力
根据HBM产能分析,中国可能在2027年年化部署24GW计算能力,远高于鹰派估计。
开放模型在全新SWE基准上全面失败,DeepSeek领先
测试显示所有开放权重模型在完全分布外的软件工程基准上表现不佳,DeepSeek稍好但与Gemini 3.1持平。
Token成本将阻止SaaS终结?
Clement Delangue认为Token成本高企使得SaaS不会被AI完全取代,好开发工具是Agent的缓存智能。
Elon Musk招人:加入特斯拉解决现实AI问题
Elon Musk呼吁加入特斯拉,专注于解决现实世界的人工智能问题。
Elon Musk招聘AI推荐与广告工程师
Elon Musk发布招聘信息,为AI推荐和广告工程团队纳新,寻求AI人才。
Chamath:开源模型能力差距缩小是最大惊喜
Chamath认为2026年最大惊喜是开源与闭源模型能力差距正在缩小。
Chollet:代码量不等于生产力
François Chollet表示代码量并不能衡量真正的生产力。
开发者:Vibe Coding名称易误导
有开发者认为Vibe Coding易引起大量AI生成垃圾代码的联想,程序员应扮演Tech Lead角色。
Codex新功能:代码修改审核和评论
Codex支持查看AI代码修改并对部分内容进行评论,提交给Agent处理。
《图解Skill》GitHub仓库已开放
该书GitHub仓库收录了所有可复制粘贴的技能模板,包括作者尚未开源的个人技能。
创意思考:用Codex远程协助修电脑
有想法在他人电脑上安装Codex以实现远程控制与Computer Use操作。
使用Omni Flash和Dreams创作3D艺术
用户展示利用Omni Flash模型和Dreams 3D工具进行AI艺术创作的工作流。
Manus AI帮助韩国药剂师从Excel解放
Manus AI案例展示药剂师利用AI自动化Excel工作,从而有更多时间服务客户。
Greg Brockman:通过Codex使用电脑更有趣
OpenAI联合创始人Greg Brockman分享使用Codex进行计算机操作的体验。
ChatGPT将集成电子邮件功能
Greg Brockman暗示ChatGPT将推出电子邮件集成功能。
Adobe推出Object-WIPER和LightMover
Adobe Research的两个AI项目聚焦于编辑现有内容而非生成新内容,提供更精细的控制。