8 мая 2026 г. · пятница

OpenAI выпускает голосовую модель GPT-Realtime-2 с рассуждениями уровня GPT-5

OpenAI представила GPT-Realtime-2 в своем API — самую интеллектуальную голосовую модель с рассуждениями уровня GPT-5 для совместного решения сложных задач в реальном времени.


GPT-Realtime-2 достигает 96,6% в бенчмарке Big Bench Audio. Голосовые агенты становятся полноценными партнёрами по совместной работе.

OpenAI официально запустила GPT-Realtime-2 в API — свою самую интеллектуальную голосовую модель. Она приносит рассуждения уровня GPT-5 голосовым агентам, позволяя им слушать, анализировать и решать сложные задачи по мере развития разговора. В бенчмарке Big Bench Audio модель поднялась с 81,4% у предшественника GPT-Realtime-1.5 до 96,6%. Сэм Альтман назвал это «значительным шагом вперёд», отметив, что пользователи всё активнее взаимодействуют с ИИ голосом, особенно когда требуется передать большой объём контекста. Одновременно OpenAI представила ещё две голосовые модели: GPT-Realtime-Translate для перевода с 70 входных языков на 13 выходных, и GPT-Realtime-Whisper для ускоренной транскрипции в реальном времени.


Исследование Anthropic: Автоэнкодер естественного языка переводит внутренние активации модели в текст

Claude говорит словами, но думает числами. Anthropic обучила модель переводить внутренние числовые активации в читаемый текст.

Anthropic обучила Claude переводить свои внутренние числовые активации в человекочитаемый текст. Модели вроде Claude общаются словами, но «думают» числами — активациями, кодирующими мысли модели в непонятной для человека форме. Новый «автоэнкодер естественного языка» впервые позволяет заглянуть в этот скрытый процесс, предоставляя исследователям инструмент для интерпретации внутреннего состояния ИИ. Это важный шаг к решению проблемы «чёрного ящика» больших языковых моделей.

Codex запускает расширение Chrome для параллельного выполнения в фоновых вкладках

Программный агент OpenAI теперь работает непосредственно в Chrome, не занимая интерфейс браузера.

Программный агент OpenAI Codex теперь работает непосредственно в Chrome на macOS и Windows. С новым расширением он способен тестировать веб-приложения, собирать контекст между вкладками и эффективно использовать DevTools в параллельном режиме — всё в фоновых вкладках, не захватывая управление браузером.

OpenAI запускает три новые голосовые модели: Разговор, Перевод и Транскрипция

GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper расширяют линейку голосового ИИ.

Вместе с GPT-Realtime-2 в Realtime API появились ещё две модели. GPT-Realtime-Translate поддерживает перевод с 70 входных языков на 13 выходных, открывая возможности для живого многоязычного общения. GPT-Realtime-Whisper ускоряет транскрипцию, значительно повышая отзывчивость приложений реального времени.

Anthropic передаёт инструмент выравнивания Petri некоммерческой организации

Anthropic передала свой опенсорсный инструмент тестирования выравнивания ИИ «Petri» некоммерческой организации Meridian Labs для обеспечения его независимого развития. Petri используется для проверки больших языковых моделей на наличие вредных тенденций — таких как обман или чрезмерная лесть — и применяется для оценки всех моделей Claude начиная с Sonnet 4.5. Вместе с передачей вышло крупное обновление до третьей версии, повышающее адаптивность, реалистичность и глубину тестов. Meridian Labs планирует интегрировать Petri с инструментами Inspect и Scout.

xAI запускает режим качества генерации изображений: более 300 млн создано в Grok

xAI представила в своём API режим качества генерации изображений, повышающий фотореализм и качество рендеринга текста. Модель уже обеспечила создание более 300 миллионов изображений в Grok и предоставляет расширенные возможности творческого контроля для бизнес-пользователей.


Продукты и агенты2026·05·08
Perplexity

Personal Computer для Mac: ИИ работает с локальными файлами и приложениями

Personal Computer от Perplexity теперь доступен через новое приложение для Mac. Продвинутая версия Perplexity Computer способна выполнять задачи с локальными файлами, нативными приложениями Mac, через веб и защищённые серверы Perplexity.

Cursor

Навык /orchestrate: рекурсивная генерация агентов для сложных задач

Новый навык /orchestrate в Cursor SDK рекурсивно порождает агентов для решения масштабных задач. Внутреннее использование позволило сократить расход токенов на 20% при автоматических исследованиях и уменьшить время холодного запуска бэкенда на 80%.

Zhipu AI

Технический отчёт GLM-5V-Turbo: нативная базовая модель для мультимодальных агентов

Технический отчёт GLM-5V-Turbo обобщает ключевые улучшения в дизайне модели, мультимодальном обучении, обучении с подкреплением, расширении цепочки инструментов и интеграции агентных фреймворков.


«GPT-Realtime-2 — это значительный шаг вперёд. Люди действительно начинают использовать голос для взаимодействия с ИИ, особенно когда нужно передать много контекста.»

— Сэм Альтман, CEO OpenAI

PhysForge: Новая платформа для создания физически интерактивных 3D-активов

PhysForge предлагает развязанную двухэтапную структуру, использующую планирование физических чертежей и управляемые физикой диффузионные модели. Результат — функциональные 3D-активы, готовые к симуляции, с высокой геометрической точностью. Статья принята на ICML 2026.

Mozilla подтверждает: Claude Mythos эффективен для поиска уязвимостей в Firefox

Mozilla применила предварительную версию Claude Mythos от Anthropic для усиления безопасности Firefox. Модель показала отличные результаты: воспроизводила реальные баги и отсеивала ложные срабатывания. Это доказывает, что Mythos — не маркетинговый хайп. Ожидается, что OpenAI, Google и открытые модели последуют примеру в ближайшие месяцы.

Anthropic полностью интегрирует Claude в Microsoft 365: Excel, Word, PowerPoint

Плагины Claude для Excel, PowerPoint и Word перешли из бета-версии в общедоступную (GA). Плагин для Outlook запущен в открытое бета-тестирование. Теперь пользователи могут обращаться к Claude напрямую из офисных приложений, не переключаясь на веб-интерфейс Claude.ai.

Исследовательский институт Anthropic TAI публикует повестку: четыре направления

TAI сосредоточится на четырёх областях: экономическая диффузия (влияние ИИ на занятость), угрозы и устойчивость (риски безопасности ИИ), ИИ в реальном мире (поведение развёрнутых систем) и ИИ-управляемые исследования (как ИИ ускоряет науку). Институт будет использовать инсайдерскую информацию передовых лабораторий и открыто публиковать выводы.

Сделка xAI и Anthropic по дата-центру Colossus: экология и внезапное отключение моделей

xAI передала Anthropic дата-центр Colossus 1, сохранив за собой более крупный Colossus 2. Colossus 1 имеет плохую экологическую репутацию: газовые турбины работали без разрешения. За день до сделки xAI уведомила пользователей об отключении Grok 4.1 Fast и ряда старых моделей всего за две недели. Илон Маск заявил, что «изымет вычислительные мощности, если ИИ навредит человечеству».

AlphaEvolve от Google DeepMind ускоряет квантовые вычисления и биотехнологии

Кодинговый агент AlphaEvolve на базе Gemini за последний год ускорил прогресс в квантовых вычислениях, биотехнологиях, логистике и даже в разработке собственного ИИ Google. Алгоритмы являются частью практически всех аспектов жизни — от физики до планирования маршрутов.


Краткие новости и статьи2026·05·08
OpenAI Devs

Опубликовано руководство по промптингу для голосовых моделей GPT-Realtime-2

Охватывает настройку глубины рассуждений, проектирование преамбул, поведение инструментов, обработку нечёткого аудио и поддержание состояния в длинных сессиях.

Sam Altman

GPT-Realtime-2 — «значительный шаг вперёд», голос в чате тоже улучшается

Альтман отметил стремительный рост использования голосового взаимодействия с ИИ и подтвердил, что команда работает над улучшением голосовых функций в чате.

Статья

Stream-R1: Дистилляция вознаграждений для потоковой генерации видео

Метод адаптивного перевзвешивания улучшает визуальное качество, качество движения и согласованность текста при генерации видео без увеличения вычислительных затрат.

Исследование

Бóльшая часть вычислений при создании LLM уходит на разработку рецепта, а не на финальный запуск

Исследование Jacob Cares показывает: подавляющая доля вычислительных ресурсов тратится на поиск оптимального «рецепта» обучения. Открытая публикация рецептов — ключ к прогрессу сообщества.

Anthropic

Программа Bug Bounty открыта для всех на платформе HackerOne

Ранее закрытая программа вознаграждений за уязвимости теперь публична. Любой желающий может сообщать об уязвимостях и получать вознаграждение.

OpenAI

Официальный CLI-инструмент openai-cli опубликован с открытым исходным кодом

Разработчики могут вызывать API прямо из терминала. Лицензия Apache 2.0, установка через Homebrew или Go. Ресурсно-ориентированная структура команд.

xAI

Grok Voice Think Fast 1.0: голосовой ИИ для клиентской поддержки

Справляется со сложными рабочими процессами даже в шумной среде. От многошаговой диагностики до массовых вызовов инструментов — сохраняет скорость и точность.

Tencent

Hunyuan Hy3 Preview: использование токенов выросло в 10 раз по сравнению с Hy2

Рост обусловлен кодингом и агентными нагрузками. Внутренние продукты Tencent — WorkBuddy, CodeBuddy и QClaw — показали рост использования токенов более чем в 16,5 раз.