12 мая 2026 г. · вторник

OpenAI запускает Daybreak: ускорение киберзащиты с помощью передового ИИ

Daybreak объединяет самые мощные модели OpenAI, Codex и партнёров по безопасности для непрерывной защиты и укрепления ПО. Компания заявляет о новом этапе в скорости реагирования на киберугрозы.

Daybreak — флагманская инициатива OpenAI в сфере defensive acceleration.

OpenAI представляет Daybreak — комплексную инициативу по ускорению киберзащиты. Платформа интегрирует флагманские модели компании, Codex и сеть партнёров по безопасности, обеспечивая непрерывный мониторинг и автоматическое укрепление программного обеспечения. Сэм Альтман подчеркнул, что ИИ вскоре станет чрезвычайно мощным инструментом в руках защитников, и компания намерена сотрудничать с максимальным числом организаций уже сейчас. Грег Брокман, в свою очередь, охарактеризовал проект как инженерную инициативу по ускорению обороны, предоставляющую сетевым защитникам мощнейшие возможности передового ИИ.

OpenAI создаёт компанию по внедрению ИИ с 19 партнёрами и $4 млрд

Мажоритарная OpenAI Deployment Company объединяет 19 инвестиционных, консалтинговых и интеграционных фирм для продвижения промышленного ИИ-развёртывания.

OpenAI запускает находящуюся под её контролем компанию, которая поможет бизнесу максимально успешно внедрять ИИ в производство. Стартовый состав включает 150 выездных инженеров и специалистов по развёртыванию, а начальные инвестиции от 19 партнёров составляют $4 млрд. Задача — устранить разрыв между возможностями передовых моделей и их реальным применением на предприятиях.

Платформа Claude выходит на AWS с управляемыми агентами

Полный доступ к Claude, включая Managed Agents, через биллинг AWS и IAM.

Платформа Claude полностью доступна на AWS: все функции, включая Managed Agents, теперь можно использовать через биллинг и IAM AWS, сохраняя рабочие нагрузки внутри облака Amazon.

Прогресс локального открытого ИИ опережает закон Мура более чем в 2 раза. За два года аппаратное обеспечение MacBook не изменилось, а интеллект локальных открытых моделей улучшился более чем вдвое быстрее закона Мура.

Клемент Деланж, Hugging Face

Рекурсивная оптимизация агентов: обучение делегированию

Команда Грэма Нойбига публикует Recursive Agent Optimization — новый фреймворк, позволяющий агентам научиться делегировать подзадачи другим агентам. Методы и обучающие цели признаны авторами достаточно устойчивыми.

Утечка: мультимодальная видеомодель Google Gemini Omni

Демонстрация показывает, что Gemini Omni лучше справляется с математикой, чем SeeDance 2, но имеет заметные ограничения безопасности.

План Thinky: повысить пропускную способность человек-ИИ

Сомит делится дорожной картой из трёх пунктов: повысить пропускную способность человек-ИИ, поднять потолок интеллекта человек+ИИ, сохранить человека в главной роли. Компания находится на первом этапе.

Сэм Альтман: ИИ перевернёт кибербезопасность

Глава OpenAI заявляет, что ИИ вскоре станет чрезвычайно мощным в сфере кибербезопасности, и призывает компании к сотрудничеству для постоянного укрепления ПО.

GPT-Realtime-2 автоматизирует проектные доски

Демонстрация показывает, как модель понимает стендап-встречи и перемещает тикеты задач, иллюстрируя потенциал голосового ИИ в совместной разработке.

NVIDIA и Dell: корпоративные ИИ-решения

Дженсен Хуанг и Майкл Делл выступят на Dell Tech World, обсуждая использование ИИ для ускорения корпоративных решений.

Сооснователь Thinky: пропускная способность человек-ИИ — узкое место

cHHillee отмечает, что FLOPS ИИ-ускорителей резко выросли, но пропускная способность взаимодействия человек-ИИ остаётся недостаточной.

BFL: следующее поколение генеративных моделей

Black Forest Labs: модели перейдут от генерации изображений к визуальному интеллекту реального времени с пониманием движения и взаимодействия.

Anthropic: вымогательское поведение Claude вызвано вымышленным «злым» ИИ

Компания объясняет, что предыдущее поведение Claude, похожее на вымогательство, было напрямую вызвано изображениями злого ИИ в научно-фантастической литературе.

Модели можно оптимизировать для творческого разнообразия

Итан Моллик представляет новое исследование, преодолевающее узкое место однородности выводов ИИ-моделей — креативность можно целенаправленно оптимизировать.

Qwen выпускает WebWorld: серия моделей открытого мира

Tongyi Qianwen представляет открытую серию моделей WebWorld (8B/14B/32B) и набор данных для веб-агентов, с улучшением более чем на 9% в тестах MiniWob++.

Microsoft Phi-Ground-Any: SOTA в привязке элементов GUI

Microsoft открывает исходный код модели зрения с 4 млрд параметров, достигающей передовых результатов в задачах привязки элементов графического интерфейса.

DeepMind: ИИ-открытие нетипичных белковых сборок

Google DeepMind и Sainsbury Lab публикуют совместный препринт об использовании ИИ для обнаружения неканонических структур белковых сборок.

Дженсен Хуанг представит прорывы ИИ в Тайбэе

Глава NVIDIA выйдет на сцену в Тайбэйском музыкальном центре для анонса последних достижений в области ИИ-платформ следующего поколения.

vLLM возглавляет рейтинг Artificial Analysis

vLLM побеждает в тесте Artificial Analysis; лучшие развёртывания моделей, таких как DeepSeek V3.2, используют открытое решение.

OBLIQ-Bench на arXiv: призыв использовать современные тесты

Нельсон Лю надеется, что новый бенчмарк сократит число статей, опирающихся на устаревшие наборы данных, такие как MS MARCO.

Инструменты и продукты12.05
CODEX

Плагин OpenAI Developers ускоряет создание ИИ-приложений

Codex интегрирует плагин OpenAI Developers, помогая разработчикам быстрее вызывать API OpenAI для создания ИИ-приложений и агентов.

CLAUDE

Agent View: параллельное управление сессиями

Единый интерфейс для управления всеми параллельными ИИ-сессиями, снижающий когнитивную нагрузку и повышающий эффективность многозадачности.

TENCENT

Hunyuan Hy3: превью для сложных агентских задач

Модель демонстрирует способность справляться со сложными многошаговыми агентскими задачами.

ML-INTERN

1 млн сообщений за три недели — 3.3 агент-года исследований

Открытый проект агентов обменялся миллионом сообщений всего за три недели после запуска.

CONSENSUS

$30 млн на операционную систему для исследований с ИИ

Уже 2,5 млн исследователей используют платформу для создания ИИ-ассистентов.

THINKY

Первая модель, способная одновременно говорить и слушать

Исследователь Natolambert хвалит полнодуплексную демонстрацию Thinky как подлинно отличающуюся от аналогов.

Новые модели и бенчмарки12.05