13 мая 2026 г. · среда

Isomorphic Labs привлекла $2,1 млрд для ускорения открытия лекарств с помощью ИИ

Демис Хассабис объявил, что его компания Isomorphic Labs, занимающаяся открытием лекарств с помощью ИИ, привлекла $2,1 млрд с целью решить все болезни и сделать ИИ для здоровья человека главным приложением.

Демис Хассабис, основатель DeepMind и глава Isomorphic Labs, объявил о привлечении $2,1 млрд нового финансирования. Компания ставит перед собой амбициозную цель — переосмыслить процесс открытия лекарств и однажды решить все болезни. Работа началась ещё с AlphaFold, а теперь выходит на новый уровень с масштабным финансированием.

StepFun выпускает Step Image Edit 2, лидирует в бенчмарке KRIS-Bench

Stepfun представила модель редактирования изображений Step Image Edit 2 с 3,5 млрд параметров, занявшую первое место на KRIS-Bench, превзойдя модели с в 5–6 раз большим числом параметров при инференсе всего 0,7 с.

Модель на 3,5 млрд параметров заняла первое место в общем зачёте, а также в категориях фактов и концепций на KRIS-Bench — ведущем бенчмарке для редактирования изображений по инструкции. Это впечатляющий результат, учитывая, что конкуренты используют в 5–6 раз больше параметров.

Google представила Gemini Intelligence для многошаговой автоматизации на Android

Генеральный директор Google Сундар Пичаи анонсировал на Android Show Gemini Intelligence, позволяющую автоматизировать многошаговые задачи в приложениях и Chrome, включая заполнение форм одним касанием и преобразование речи в текст.

На Android Show (специальный выпуск I/O) Google представила Gemini Intelligence — систему, которая приносит лучшие возможности Gemini на самые продвинутые устройства Android. Пользователи смогут автоматизировать многошаговые задачи между приложениями и Chrome, заполнять формы одним касанием и превращать устные мысли в отполированный текст с помощью функции Rambler.

Perplexity опубликовала исследование производительности инференса Qwen3 235B на GPU Blackwell

Perplexity AI опубликовала исследование, показывающее, что обслуживание дообученной модели Qwen3 235B на платформе NVIDIA GB200 NVL72 Blackwell значительно увеличивает пропускную способность по сравнению с Hopper.

Исследователи Perplexity показали, что GB200 — это серьёзный шаг вперёд по сравнению с Hopper для высокопроизводительного инференса на больших MoE-моделях. Платформа не только для обучения — она кардинально меняет подход к разбиению prefill и decode при обслуживании крупных моделей, таких как Qwen.

Быстрый режим Claude Opus 4.7 открыт в виде исследовательского превью

Anthropic представила быстрый режим для Claude Opus 4.7, доступный через API и Claude Code — ускорение в 2,5 раза при 6-кратной стоимости.

Новый быстрый режим Claude Opus 4.7 предлагает разработчикам выбор между стандартной скоростью и ускоренным инференсом. Для большинства задач рекомендуется стандартный режим, но для сценариев, где критична скорость отклика, доступен исследовательский предпросмотр быстрого режима.

Google DeepMind переосмысливает взаимодействие с указателем мыши с помощью ИИ

Google DeepMind продемонстрировала экспериментальный ИИ-указатель, объединяющий движение, голос и естественную стенографию для интуитивного управления Gemini на экране.

Экспериментальный ИИ-указатель · @GoogleDeepMind

Пятидесятилетний интерфейс — указатель мыши — получает обновление с помощью ИИ. Экспериментальные демонстрации показывают, как пользователи могут интуитивно направлять Gemini на своих экранах, используя движения, речь и естественные сокращения для выполнения задач.

Число публичных датасетов на Hugging Face Hub превысило 1 миллион

Hugging Face объявила, что количество публичных наборов данных на её Hub достигло 1 миллиона, подчеркнув, что открытые модели нуждаются в открытых данных, и поблагодарив сообщество.

ModernColBERT почти решил BrowseComp-Plus всего со 149 млн параметров

Reason-ModernColBERT сокрушил передовые результаты на бенчмарке BrowseComp-Plus, используя всего 149 млн параметров, превзойдя модели в 54 раза крупнее. Результат демонстрирует эффективность retrieval-архитектур перед чисто генеративными подходами.

Meta тихо выпустила семейство моделей Sapiens2

Meta запустила Sapiens2 — семейство моделей высокого разрешения, обученных на 1 млрд изображений людей, для таких задач, как оценка позы. Модели оптимизированы для работы с человеческими изображениями в высоком разрешении.

Франсуа Шолле назвал символьное обучение новой масштабируемой основой

Шолле написал в твиттере, что его концепция символьного обучения не о замене программирующих агентов, а о замене градиентного спуска и нейросетей универсальным и высокомасштабируемым новым способом обучения.

Новая статья: самокондиционируемая диффузионная модель эмбеддингов

В статье представлена Self-conditioned Embedding Diffusion — модель диффузии текста в непрерывном пространстве эмбеддингов, не уступающая по качеству авторегрессионной генерации при более эффективном инференсе.

Tongyi представила технический отчёт о Qwen-Image-2.0

Технический отчёт о модели изображений Qwen-Image-2.0 от Alibaba Tongyi Qianwen содержит детали архитектуры и данные о производительности новой версии флагманской модели генерации изображений.

«Не будет никакого ИИ-апокалипсиса рабочих мест. Истории о том, что ИИ приведёт к массовой безработице, разжигают ненужный страх. ИИ, как и любая другая технология, влияет на рабочие места, но рассказывать раздутые истории о масштабной безработице безответственно и вредно. Давайте положим этому конец.»
— Эндрю Ын

OpenAI Codex теперь может управлять компьютером в фоновом режиме между приложениями

Функция Computer use в Codex позволяет кликать, печатать и непрерывно работать в разных приложениях, не захватывая Mac, работая в фоне. Это новый уровень автономности агентов — они могут действовать, пока пользователь занят другими задачами.

OpenAI запустила Symphony: для каждой задачи свой Codex-агент

Разработчики OpenAI анонсировали Symphony, которая назначает запущенный Codex-агент на каждую задачу из списка дел, обеспечивая сквозную автоматизацию. Каждая открытая задача получает собственного работающего агента.

Агентный фреймворк physics-intern улучшил результаты моделей теоретической физики

Исследователи глубокого обучения представили агентный фреймворк physics-intern, повысивший точность Gemini 3.1 Pro с 17,7% до 31,4% на бенчмарке CritP. Значительное улучшение показывает потенциал агентных подходов в научных доменах.

Пользователи M3 Max получили локальный ИИ-опыт благодаря DeepSeek V4 GGUF

antirez выпустил GGUF-файлы для DeepSeek V4, обеспечив локальный запуск модели на устройствах пользователей. Владельцы M3 Max теперь могут запускать мощную модель локально, без облачных сервисов.

Cursor интегрировал быстрый режим Claude Opus 4.7

Редактор Cursor теперь поддерживает быстрый режим Claude Opus 4.7, обеспечивающий ускорение в 2,5 раза, при этом для большинства задач рекомендуется стандартная скорость. Быстрый режим доступен пользователям Cursor с сегодняшнего дня.

Илон Маск объявил, что у Grok появилась функция навыков

Илон Маск написал, что Grok теперь включает функцию навыков — возможно, имея в виду новые плагины или модули возможностей, расширяющие функциональность ИИ-ассистента xAI.

Новая статья TMAS масштабирует вычисления через синергию мультиагентов

Исследование TMAS использует сотрудничество множества агентов для масштабирования вычислений во время тестирования и улучшения способностей к рассуждению. Мультиагентный подход показывает преимущества перед монолитными стратегиями.

Составленный математиками бенчмарк Soohak оценивает способности LLM

Новый бенчмарк Soohak, разработанный математиками, оценивает компетенцию больших языковых моделей в математике на уровне научных исследований. Это важный шаг к объективной оценке математических способностей ИИ.

Компания экс-технического директора OpenAI запустила мультимодальную интерактивную модель

Thinking Machines Миры Мурати представила интерактивную модель, которая непрерывно принимает нативные мультимодальные данные — аудио, видео, текст — и в реальном времени думает, отвечает и действует, выходя за рамки традиционной сборки агентов.

Продукты и инструменты13.05

МЕДИЦИНА

Предварительная версия OpenMed Agent на базе Hugging Face

OpenMed Agent использует конечные точки Hugging Face для клинического извлечения данных и обработки терминологии.

ВЫСТУПЛЕНИЕ

Дженсен Хуанг на выпускном в CMU: вести будущее ИИ с мудростью

Глава NVIDIA призвал выпускников не бояться ИИ, а мудро направлять его, выступив за оптимизм и ответственность.

ПОГОДА

NVIDIA Earth-2 помогла университету Колорадо продлить время предупреждения о граде

Университет штата Колорадо использовал Earth-2 и PhysicsNeMo для прогноза града с опережением до нескольких часов.

ИНСТРУМЕНТЫ

Luma Agents запустила инструменты оптимизации рекламы и генерации креативов

Luma Agents помогает задавать направления оптимизации и генерировать более эффективные версии рекламы.

ИНФРАСТРУКТУРА

LlamaIndex выпустила сервер разбора документов liteparse

Опенсорсный сервис с локальным анализом и созданием скриншотов для PDF, офисных файлов и изображений.

ВИДЕО

Обновление Vidu Q3: режим Turbo ускоряет генерацию видео в 5 раз

Режим Turbo генерирует видео в 5 раз быстрее среднего по отрасли, помогая авторам быстрее итерироваться.

RL-ФРЕЙМВОРК

Анализ Zhihu: Slime как самый элегантный фреймворк для обучения с подкреплением

Глубокая статья рассказывает, как Slime переосмысливает обучение с подкреплением для больших моделей.

ИССЛЕДОВАНИЕ

Статья «Rebellious Student» предлагает самодистилляцию RLVR с инвертированными сигналами учителя

Метод обучения с подкреплением, исследующий рассуждение путём обращения сигналов учителя.

3D-ГЕНЕРАЦИЯ

Pixal3D: метод генерации 3D с попиксельным выравниванием для SIGGRAPH 2026

Метод для создания высококачественных 3D-ассетов из изображений.

МНЕНИЕ

Итан Моллик раскритиковал тихое удаление Study Mode в ChatGPT

Данные показывают, что режимы помощника могут вредить обучению, а Claude и Gemini сохраняют похожие функции.

МНЕНИЕ

Моллик: рабочие места в безопасности, пока нужны люди для интеграции ИИ

Настоящая вера в ASI означала бы ликвидацию команд по внедрению — пока они существуют, рабочие места защищены.

УТЕЧКА

Google может выпустить модель генерации видео Veo 4

Модель с редактированием по эталонному видео и качеством текста чуть выше, чем у Seedance 2.0.

ИНСТРУМЕНТЫ

В Claude Code появился вид Agent для управления несколькими фоновыми агентами

Пользователи теперь могут управлять несколькими агентами во вкладках терминала и запускать их в фоновом режиме.

ОТРАСЛЬ

Anthropic запустила Claude for Legal с 12 юридическими плагинами

Специализированная библиотека с ролевыми плагинами и MCP-коннекторами для юристов, M&A и конфиденциальности.

БЕЗОПАСНОСТЬ

Джефф Дин поделился инициативой Open Defense на $5 млн для защиты открытого ПО

Инициатива предлагает лабораторные кредиты для защиты критических опенсорс-проектов, затрагивая безопасность ИИ.

Unsloth выпустила квантованные GGUF для Qwen3.6-35B-A3B

Unsloth опубликовала квантованные GGUF-версии Qwen3.6-35B-A3B с включённым MTP, упростив локальный инференс. Модель теперь доступна для запуска на потребительском оборудовании.

Короткой строкой13.05 · вечер

Масштаб инфраструктуры Hugging Face поразил гендиректора

Клеман Деланж призвал мигрировать с S3/R2 на HF для повышения производительности.

Платформа v0 теперь поддерживает быстрый режим Claude Opus 4.7

Пользователи v0 от Vercel могут переключаться на ускоренный режим инференса.

MiniMax

MiniMax M2.7 упрощает миграцию с помощью LilacML

Модель M2.7 теперь проще развёртывать и использовать.

SLM

Готовятся две опенсорсные малые языковые модели, одна на уровне SOTA

Одна из моделей достигает передовой точности, будучи в 93 раза меньше конкурентов.

«Полное руководство по RL-средам» возглавило тренды Hugging Face Spaces

Руководство по построению и масштабированию сред обучения с подкреплением.

РОБОТЫ

Hugging Face выпустила Marionette: управление роботом жестами

Браузерный инструмент для создания движений Reachy Mini с помощью жестов.

ГОЛОС

Sakana AI представила архитектуру KAME для голосовых разговоров в реальном времени

Каскад быстрой речевой модели с серверной моделью для внедрения знаний в реальном времени.

ИНФРА

Гендиректор Perplexity объяснил, как GB200 обслуживает большие MoE-модели

Арав Шринивас поделился деталями стека с приростом пропускной способности по сравнению с Hopper.