13 de mayo de 2026 · miércoles

Isomorphic Labs obtiene 2.100 millones de dólares para acelerar el descubrimiento de fármacos con IA

Demis Hassabis anunció que su empresa de descubrimiento de fármacos con IA, Isomorphic Labs, captó 2.100 millones de dólares con el objetivo de resolver todas las enfermedades y convertir la IA en la aplicación prioritaria para la salud humana.

Demis Hassabis, fundador de Isomorphic Labs, anuncia la ronda de financiación de 2.100 millones de dólares.

El anuncio de Demis Hassabis marca un hito en la convergencia entre inteligencia artificial y biomedicina. La financiación de 2.100 millones de dólares para Isomorphic Labs representa una de las mayores apuestas por el descubrimiento de fármacos asistido por IA, con la ambición declarada de resolver todas las enfermedades. Hassabis, también fundador de Google DeepMind, ha sostenido que la aplicación prioritaria de la IA debe ser la mejora de la salud humana, una visión que comenzó con AlphaFold y ahora se acelera con esta inyección de capital. Isomorphic Labs aspira a reinventar el proceso completo de descubrimiento de medicamentos, desde la identificación de dianas terapéuticas hasta los ensayos clínicos, utilizando modelos de aprendizaje profundo para simular interacciones moleculares a una escala sin precedentes.

StepFun lanza Step Image Edit 2, lidera en KRIS-Bench de edición de imágenes

El modelo de 3.500 millones de parámetros supera a rivales con 5-6 veces más parámetros.

Stepfun presentó Step Image Edit 2, un modelo de edición de imágenes de 3.500 millones de parámetros que ocupa el primer puesto general y en las categorías factual y conceptual del benchmark KRIS-Bench. El modelo logra superar a competidores con entre cinco y seis veces más parámetros, realizando la inferencia en solo 0,7 segundos. Este resultado demuestra que la eficiencia paramétrica sigue siendo una frontera activa en los modelos generativos de imagen.

Google presenta Gemini Intelligence para automatización multietapa en Android

El CEO Sundar Pichai anuncia automatización entre aplicaciones y Chrome con un solo toque.

Sundar Pichai presentó Gemini Intelligence durante el Android Show, una nueva capacidad que permite automatizar tareas complejas entre aplicaciones y Chrome. Entre las funciones destacan el rellenado de formularios con un solo toque, la transformación de voz a texto pulido mediante Rambler, y la ejecución de flujos de trabajo multietapa en segundo plano. La integración profunda con el ecosistema Android marca un paso significativo hacia asistentes verdaderamente agentivos en dispositivos móviles.

Despliegue de inferencia del modelo Qwen3 235B en racks NVIDIA GB200 NVL72 Blackwell.

Perplexity publica estudio de rendimiento de inferencia de Qwen3 235B en GPU Blackwell

La plataforma GB200 NVL72 ofrece un salto significativo en el rendimiento de modelos MoE grandes frente a Hopper.

Perplexity AI publicó una investigación que cuantifica las ventajas de servir el modelo Qwen3 235B post-entrenado sobre la plataforma NVIDIA GB200 NVL72 Blackwell. Los resultados muestran que la arquitectura Blackwell no solo beneficia el entrenamiento, sino que transforma radicalmente la inferencia de alto rendimiento para modelos Mixture-of-Experts de gran escala. El CEO de Perplexity, Arav Srinivas, detalló que la desagregación de prefill y decode en GB200 cambia por completo la forma de servir modelos MoE como Qwen, con ganancias de throughput sustanciales respecto a generaciones anteriores.

El aprendizaje simbólico no reemplaza a los agentes de programación, es un sustituto del descenso de gradiente y las redes neuronales: un nuevo sustrato de aprendizaje general, completamente nuevo y extremadamente escalable.
— François Chollet

Modo rápido de Claude Opus 4.7 se abre como vista previa de investigación

Anthropic presentó un modo rápido para Claude Opus 4.7, disponible como vista previa de investigación a través de la API y Claude Code. Ofrece 2,5 veces más velocidad a un costo 6 veces mayor. La función ya está disponible también en Cursor y en la plataforma v0 de Vercel.

Google DeepMind rediseña la interacción del puntero del ratón con IA

Google DeepMind mostró un puntero experimental con IA que fusiona movimiento, voz y taquigrafía natural, permitiendo a los usuarios dirigir a Gemini en pantalla de forma intuitiva, reinventando una interfaz de 50 años de antigüedad.

Hugging Face Hub supera el millón de conjuntos de datos públicos

Hugging Face anunció que su Hub ha alcanzado un millón de datasets públicos, subrayando que los modelos abiertos necesitan datos abiertos. El hito representa petabytes de datos disponibles para millones de desarrolladores de IA en todo el mundo.

ModernColBERT casi resuelve BrowseComp-Plus con solo 149M de parámetros

Reason-ModernColBERT aplasta el estado del arte en BrowseComp-Plus usando únicamente 149 millones de parámetros, superando a modelos 54 veces más grandes. El resultado demuestra que las arquitecturas de recuperación eficientes siguen siendo competitivas frente a los modelos masivos.

Meta lanza silenciosamente la familia de modelos Sapiens2 de alta resolución

Meta presentó Sapiens2, una familia de modelos de alta resolución entrenados en 1.000 millones de imágenes humanas, diseñados para tareas como la estimación de poses, segmentación y análisis de forma humana.

Tongyi publica informe técnico de Qwen-Image-2.0

El informe técnico del modelo de imagen Qwen-Image-2.0 de Alibaba Tongyi Qianwen fue compartido por la comunidad, detallando la arquitectura y los datos de rendimiento del nuevo modelo de generación visual.

Nuevo artículo: modelo de difusión de embeddings iguala a la generación autorregresiva

Un artículo presenta Self-conditioned Embedding Diffusion, un modelo de difusión de texto en espacio continuo de embeddings que iguala la calidad de los modelos autorregresivos con una inferencia teóricamente más eficiente en hardware acelerador.

La empresa de la ex CTO de OpenAI lanza un modelo interactivo multimodal en tiempo real

Thinking Machines, la compañía fundada por Mira Murati, presentó un modelo interactivo que ingiere de forma continua entradas multimodales nativas —audio, vídeo y texto— y piensa, responde y actúa en tiempo real, todo dentro de un único modelo unificado, superando la arquitectura tradicional de agentes que encadena múltiples modelos especializados.

Agentes y Herramientas13·05

PRODUCTO

Codex ya controla ordenadores entre aplicaciones en segundo plano

La función Computer use de OpenAI Codex permite hacer clic, escribir y trabajar de forma continua entre aplicaciones sin tomar el control del Mac, ejecutándose en segundo plano.

PRODUCTO

OpenAI lanza Symphony: un agente Codex dedicado para cada tarea

Symphony asigna un agente Codex en ejecución a cada tarea pendiente en la lista de tareas, permitiendo la automatización completa de principio a fin.

PRODUCTO

Elon Musk anuncia que Grok ahora tiene función de habilidades

Grok incorpora una nueva función de habilidades, posiblemente refiriéndose a nuevos módulos de complementos o capacidades ampliadas dentro del asistente de xAI.

INVESTIGACIÓN

El marco physics-intern eleva la precisión en física teórica del 17,7% al 31,4%

Un framework agéntico mejora el rendimiento de Gemini 3.1 Pro en el benchmark CritP, demostrando el valor de los agentes especializados para dominios científicos complejos.

MODELO

Usuarios de M3 Max logran experiencia de IA local con DeepSeek V4 GGUF

antirez publicó archivos GGUF de DeepSeek V4, permitiendo la ejecución local del modelo en hardware de consumo como los Mac con chip M3 Max.

OPINIÓN

Andrew Ng desestima el apocalipsis laboral de la IA

Andrew Ng calificó de irresponsables las narrativas sobre desempleo masivo por IA, argumentando que las olas tecnológicas acaban creando más empleos de los que destruyen.

PAPER

TMAS escala el cómputo en tiempo de prueba mediante sinergia multiagente

La investigación TMAS aprovecha la colaboración entre múltiples agentes para escalar el cómputo durante la fase de prueba y mejorar las capacidades de razonamiento.

BENCHMARK

Soohak: benchmark curado por matemáticos evalúa la capacidad de los LLM

Un nuevo benchmark elaborado por matemáticos evalúa la competencia de los grandes modelos de lenguaje en matemáticas de nivel de investigación.

HERRAMIENTA

Cursor integra el modo rápido de Claude Opus 4.7

El editor Cursor ya admite el modo rápido de Claude Opus 4.7 con velocidad 2,5× mayor, aunque recomienda la velocidad estándar para la mayoría de las tareas.

Investigación e Industria13·05

INFRA

La escala de infraestructura de Hugging Face asombra a su CEO

Clement Delangue recomendó a quienes aún usan S3 o R2 migrar a HF para obtener mejor rendimiento y seguridad.

MODELO

Unsloth publica GGUF cuantizado para Qwen3.6-35B-A3B

Versiones GGUF cuantizadas con MTP habilitado facilitan la inferencia local del modelo Qwen3.6-35B-A3B.

SALUD

Vista previa de OpenMed Agent, construido sobre Hugging Face

OpenMed Agent aprovecha los endpoints de Hugging Face para extracción clínica y procesamiento de terminología médica.

DISCURSO

Jensen Huang en la graduación de CMU: liderar el futuro de la IA con sabiduría

El CEO de NVIDIA dijo a los graduados de Carnegie Mellon que no teman a la IA, sino que la guíen con optimismo, responsabilidad y ambición.

CIENCIA

NVIDIA Earth-2 amplía el tiempo de aviso de granizo de minutos a horas

La Universidad Estatal de Colorado utilizó Earth-2 y PhysicsNeMo para mejorar la predicción de granizo con IA generativa y datos de radar.

HERRAMIENTA

LlamaIndex publica liteparse, servidor autogestionado de análisis de documentos

Servicio de código abierto totalmente autogestionado para análisis local y captura de pantalla de PDFs, archivos de Office e imágenes.

FRAMEWORK

Slime: el framework más elegante para entrenamiento RL de grandes modelos

Un análisis en profundidad explora cómo Slime redefine el entrenamiento de aprendizaje por refuerzo para modelos de lenguaje a gran escala.

VOZ

Sakana AI presenta la arquitectura KAME de conversación de voz en tiempo real

KAME encadena un modelo de voz rápido con un gran modelo de backend para inyectar conocimiento en conversaciones de voz en tiempo real.

PAPER

Rebellious Student: auto-destilación RLVR con señales invertidas del profesor

Un nuevo método de aprendizaje por refuerzo explora el razonamiento invirtiendo las señales del profesor para mejorar la exploración.

ANÁLISIS

Ethan Mollick critica que ChatGPT retire discretamente el Modo Estudio

Mollick citó evidencia de que los modos de asistente pueden perjudicar el aprendizaje, mientras Claude y Gemini aún conservan funciones similares.

OPINIÓN

Mollick: los empleos están seguros mientras se necesite integración humana

La verdadera creencia en la ASI implicaría eliminar los equipos de despliegue; mientras existan, el trabajo humano sigue siendo necesario.

FILTRACIÓN

Google podría lanzar Veo 4, con generación de texto ligeramente mejor que Seedance 2

El modelo de generación de video incluiría edición de video de referencia y una calidad de texto superior a Seedance 2.0.

HERRAMIENTA

Claude Code añade vista de Agente para gestionar múltiples agentes en segundo plano

La actualización permite verificar el estado de cada agente y lanzar nuevos en segundo plano desde pestañas de terminal.

PAPER

Pixal3D: generación 3D alineada a píxeles para SIGGRAPH 2026

Un método alineado a píxeles genera activos 3D de alta fidelidad a partir de imágenes, presentado para la conferencia SIGGRAPH 2026.

LEGAL

Anthropic lanza Claude for Legal con 12 complementos jurídicos

La biblioteca especializada ofrece conectores MCP para operaciones legales, fusiones y adquisiciones, privacidad y más.

PRODUCTO

Luma Agents lanza herramientas de optimización de anuncios con IA

Luma Agents ayuda a los equipos a establecer direcciones de optimización y generar versiones de anuncios de mayor rendimiento.

DEMO

CTO de Modular construye un libro de cuentos con FLUX2 y Gemma 4

Aplicación de libro de cuentos con IA creada con FLUX2 de Black Forest Labs y Google Gemma 4 sobre Modular Cloud.

VIDEO

Vidu Q3: modo Turbo 5 veces más rápido en generación de video

El modo Turbo genera video a una velocidad 5 veces superior al promedio de la industria, ayudando a los creadores a iterar más rápido.

EVENTO

Replit celebrará Vibecon en Nueva York para explorar el código como medio creativo

La conferencia reunirá a Spike Jonze y otros creadores en junio para explorar la IA aplicada al código creativo como nuevo medio artístico.

MODELO

Dos modelos de lenguaje pequeños de código abierto igualan el SOTA

Un desarrollador adelantó dos SLM de código abierto, uno de los cuales alcanza precisión de última generación siendo 93 veces más pequeño.

COMUNIDAD

Guía Definitiva de Entornos RL encabeza tendencias en Hugging Face Spaces

Una guía sobre construcción y escalado de entornos de aprendizaje por refuerzo alcanzó el primer puesto en tendencias.

PRODUCTO

Higgsfield y Claude se unen para generación automática de anuncios DTC

La solución MCP genera automáticamente anuncios DTC en 40 estilos, sin errores de texto y con capacidad de escalado masivo.

MODELO

MiniMax M2.7 permite una migración más fluida a través de LilacML

El modelo M2.7 ahora es más fácil de implementar y usar con la ayuda de LilacML, facilitando su adopción.

COMUNIDAD

OpenAI celebra el éxito del evento parameter golf con más de 2.000 envíos

El evento comunitario atrajo más de 2.000 propuestas y más de 1.000 cuentas verificadas de GitHub, explorando técnicas de optimización de modelos.

ROBÓTICA

Marionette: herramienta para crear movimientos robóticos mediante gestos

Herramienta de navegador que permite crear movimientos para el robot Reachy Mini mediante gestos desde el teléfono o la computadora.

Jeff Dean comparte iniciativa Open Defense de $5M para seguridad de código abierto

La iniciativa ofrece hasta 5 millones de dólares en créditos de laboratorio para proteger proyectos críticos de código abierto vinculados a la seguridad de la IA.

v0 añade modo de control de permisos para ejecución de comandos

Los usuarios pueden elegir entre preguntar siempre, decisión automática o acceso total antes de que el agente ejecute comandos.