Isomorphic Labs obtiene 2.100 millones de dólares para acelerar el descubrimiento de fármacos con IA
Demis Hassabis anunció que su empresa de descubrimiento de fármacos con IA, Isomorphic Labs, captó 2.100 millones de dólares con el objetivo de resolver todas las enfermedades y convertir la IA en la aplicación prioritaria para la salud humana.

El anuncio de Demis Hassabis marca un hito en la convergencia entre inteligencia artificial y biomedicina. La financiación de 2.100 millones de dólares para Isomorphic Labs representa una de las mayores apuestas por el descubrimiento de fármacos asistido por IA, con la ambición declarada de resolver todas las enfermedades. Hassabis, también fundador de Google DeepMind, ha sostenido que la aplicación prioritaria de la IA debe ser la mejora de la salud humana, una visión que comenzó con AlphaFold y ahora se acelera con esta inyección de capital. Isomorphic Labs aspira a reinventar el proceso completo de descubrimiento de medicamentos, desde la identificación de dianas terapéuticas hasta los ensayos clínicos, utilizando modelos de aprendizaje profundo para simular interacciones moleculares a una escala sin precedentes.

StepFun lanza Step Image Edit 2, lidera en KRIS-Bench de edición de imágenes
El modelo de 3.500 millones de parámetros supera a rivales con 5-6 veces más parámetros.
Stepfun presentó Step Image Edit 2, un modelo de edición de imágenes de 3.500 millones de parámetros que ocupa el primer puesto general y en las categorías factual y conceptual del benchmark KRIS-Bench. El modelo logra superar a competidores con entre cinco y seis veces más parámetros, realizando la inferencia en solo 0,7 segundos. Este resultado demuestra que la eficiencia paramétrica sigue siendo una frontera activa en los modelos generativos de imagen.

Google presenta Gemini Intelligence para automatización multietapa en Android
El CEO Sundar Pichai anuncia automatización entre aplicaciones y Chrome con un solo toque.
Sundar Pichai presentó Gemini Intelligence durante el Android Show, una nueva capacidad que permite automatizar tareas complejas entre aplicaciones y Chrome. Entre las funciones destacan el rellenado de formularios con un solo toque, la transformación de voz a texto pulido mediante Rambler, y la ejecución de flujos de trabajo multietapa en segundo plano. La integración profunda con el ecosistema Android marca un paso significativo hacia asistentes verdaderamente agentivos en dispositivos móviles.

Perplexity publica estudio de rendimiento de inferencia de Qwen3 235B en GPU Blackwell
La plataforma GB200 NVL72 ofrece un salto significativo en el rendimiento de modelos MoE grandes frente a Hopper.
Perplexity AI publicó una investigación que cuantifica las ventajas de servir el modelo Qwen3 235B post-entrenado sobre la plataforma NVIDIA GB200 NVL72 Blackwell. Los resultados muestran que la arquitectura Blackwell no solo beneficia el entrenamiento, sino que transforma radicalmente la inferencia de alto rendimiento para modelos Mixture-of-Experts de gran escala. El CEO de Perplexity, Arav Srinivas, detalló que la desagregación de prefill y decode en GB200 cambia por completo la forma de servir modelos MoE como Qwen, con ganancias de throughput sustanciales respecto a generaciones anteriores.
El aprendizaje simbólico no reemplaza a los agentes de programación, es un sustituto del descenso de gradiente y las redes neuronales: un nuevo sustrato de aprendizaje general, completamente nuevo y extremadamente escalable.
— François Chollet
Modo rápido de Claude Opus 4.7 se abre como vista previa de investigación
Anthropic presentó un modo rápido para Claude Opus 4.7, disponible como vista previa de investigación a través de la API y Claude Code. Ofrece 2,5 veces más velocidad a un costo 6 veces mayor. La función ya está disponible también en Cursor y en la plataforma v0 de Vercel.

Google DeepMind rediseña la interacción del puntero del ratón con IA
Google DeepMind mostró un puntero experimental con IA que fusiona movimiento, voz y taquigrafía natural, permitiendo a los usuarios dirigir a Gemini en pantalla de forma intuitiva, reinventando una interfaz de 50 años de antigüedad.

Hugging Face Hub supera el millón de conjuntos de datos públicos
Hugging Face anunció que su Hub ha alcanzado un millón de datasets públicos, subrayando que los modelos abiertos necesitan datos abiertos. El hito representa petabytes de datos disponibles para millones de desarrolladores de IA en todo el mundo.
ModernColBERT casi resuelve BrowseComp-Plus con solo 149M de parámetros
Reason-ModernColBERT aplasta el estado del arte en BrowseComp-Plus usando únicamente 149 millones de parámetros, superando a modelos 54 veces más grandes. El resultado demuestra que las arquitecturas de recuperación eficientes siguen siendo competitivas frente a los modelos masivos.
Meta lanza silenciosamente la familia de modelos Sapiens2 de alta resolución
Meta presentó Sapiens2, una familia de modelos de alta resolución entrenados en 1.000 millones de imágenes humanas, diseñados para tareas como la estimación de poses, segmentación y análisis de forma humana.

Tongyi publica informe técnico de Qwen-Image-2.0
El informe técnico del modelo de imagen Qwen-Image-2.0 de Alibaba Tongyi Qianwen fue compartido por la comunidad, detallando la arquitectura y los datos de rendimiento del nuevo modelo de generación visual.
Nuevo artículo: modelo de difusión de embeddings iguala a la generación autorregresiva
Un artículo presenta Self-conditioned Embedding Diffusion, un modelo de difusión de texto en espacio continuo de embeddings que iguala la calidad de los modelos autorregresivos con una inferencia teóricamente más eficiente en hardware acelerador.

La empresa de la ex CTO de OpenAI lanza un modelo interactivo multimodal en tiempo real
Thinking Machines, la compañía fundada por Mira Murati, presentó un modelo interactivo que ingiere de forma continua entradas multimodales nativas —audio, vídeo y texto— y piensa, responde y actúa en tiempo real, todo dentro de un único modelo unificado, superando la arquitectura tradicional de agentes que encadena múltiples modelos especializados.
Codex ya controla ordenadores entre aplicaciones en segundo plano
La función Computer use de OpenAI Codex permite hacer clic, escribir y trabajar de forma continua entre aplicaciones sin tomar el control del Mac, ejecutándose en segundo plano.
OpenAI lanza Symphony: un agente Codex dedicado para cada tarea
Symphony asigna un agente Codex en ejecución a cada tarea pendiente en la lista de tareas, permitiendo la automatización completa de principio a fin.
Elon Musk anuncia que Grok ahora tiene función de habilidades
Grok incorpora una nueva función de habilidades, posiblemente refiriéndose a nuevos módulos de complementos o capacidades ampliadas dentro del asistente de xAI.
El marco physics-intern eleva la precisión en física teórica del 17,7% al 31,4%
Un framework agéntico mejora el rendimiento de Gemini 3.1 Pro en el benchmark CritP, demostrando el valor de los agentes especializados para dominios científicos complejos.
Usuarios de M3 Max logran experiencia de IA local con DeepSeek V4 GGUF
antirez publicó archivos GGUF de DeepSeek V4, permitiendo la ejecución local del modelo en hardware de consumo como los Mac con chip M3 Max.
Andrew Ng desestima el apocalipsis laboral de la IA
Andrew Ng calificó de irresponsables las narrativas sobre desempleo masivo por IA, argumentando que las olas tecnológicas acaban creando más empleos de los que destruyen.
TMAS escala el cómputo en tiempo de prueba mediante sinergia multiagente
La investigación TMAS aprovecha la colaboración entre múltiples agentes para escalar el cómputo durante la fase de prueba y mejorar las capacidades de razonamiento.
Soohak: benchmark curado por matemáticos evalúa la capacidad de los LLM
Un nuevo benchmark elaborado por matemáticos evalúa la competencia de los grandes modelos de lenguaje en matemáticas de nivel de investigación.
Cursor integra el modo rápido de Claude Opus 4.7
El editor Cursor ya admite el modo rápido de Claude Opus 4.7 con velocidad 2,5× mayor, aunque recomienda la velocidad estándar para la mayoría de las tareas.
La escala de infraestructura de Hugging Face asombra a su CEO
Clement Delangue recomendó a quienes aún usan S3 o R2 migrar a HF para obtener mejor rendimiento y seguridad.
Unsloth publica GGUF cuantizado para Qwen3.6-35B-A3B
Versiones GGUF cuantizadas con MTP habilitado facilitan la inferencia local del modelo Qwen3.6-35B-A3B.
Vista previa de OpenMed Agent, construido sobre Hugging Face
OpenMed Agent aprovecha los endpoints de Hugging Face para extracción clínica y procesamiento de terminología médica.
Jensen Huang en la graduación de CMU: liderar el futuro de la IA con sabiduría
El CEO de NVIDIA dijo a los graduados de Carnegie Mellon que no teman a la IA, sino que la guíen con optimismo, responsabilidad y ambición.
NVIDIA Earth-2 amplía el tiempo de aviso de granizo de minutos a horas
La Universidad Estatal de Colorado utilizó Earth-2 y PhysicsNeMo para mejorar la predicción de granizo con IA generativa y datos de radar.
LlamaIndex publica liteparse, servidor autogestionado de análisis de documentos
Servicio de código abierto totalmente autogestionado para análisis local y captura de pantalla de PDFs, archivos de Office e imágenes.
Slime: el framework más elegante para entrenamiento RL de grandes modelos
Un análisis en profundidad explora cómo Slime redefine el entrenamiento de aprendizaje por refuerzo para modelos de lenguaje a gran escala.
Sakana AI presenta la arquitectura KAME de conversación de voz en tiempo real
KAME encadena un modelo de voz rápido con un gran modelo de backend para inyectar conocimiento en conversaciones de voz en tiempo real.
Rebellious Student: auto-destilación RLVR con señales invertidas del profesor
Un nuevo método de aprendizaje por refuerzo explora el razonamiento invirtiendo las señales del profesor para mejorar la exploración.
Ethan Mollick critica que ChatGPT retire discretamente el Modo Estudio
Mollick citó evidencia de que los modos de asistente pueden perjudicar el aprendizaje, mientras Claude y Gemini aún conservan funciones similares.
Mollick: los empleos están seguros mientras se necesite integración humana
La verdadera creencia en la ASI implicaría eliminar los equipos de despliegue; mientras existan, el trabajo humano sigue siendo necesario.
Google podría lanzar Veo 4, con generación de texto ligeramente mejor que Seedance 2
El modelo de generación de video incluiría edición de video de referencia y una calidad de texto superior a Seedance 2.0.
Claude Code añade vista de Agente para gestionar múltiples agentes en segundo plano
La actualización permite verificar el estado de cada agente y lanzar nuevos en segundo plano desde pestañas de terminal.
Pixal3D: generación 3D alineada a píxeles para SIGGRAPH 2026
Un método alineado a píxeles genera activos 3D de alta fidelidad a partir de imágenes, presentado para la conferencia SIGGRAPH 2026.
Anthropic lanza Claude for Legal con 12 complementos jurídicos
La biblioteca especializada ofrece conectores MCP para operaciones legales, fusiones y adquisiciones, privacidad y más.
Luma Agents lanza herramientas de optimización de anuncios con IA
Luma Agents ayuda a los equipos a establecer direcciones de optimización y generar versiones de anuncios de mayor rendimiento.
CTO de Modular construye un libro de cuentos con FLUX2 y Gemma 4
Aplicación de libro de cuentos con IA creada con FLUX2 de Black Forest Labs y Google Gemma 4 sobre Modular Cloud.
Vidu Q3: modo Turbo 5 veces más rápido en generación de video
El modo Turbo genera video a una velocidad 5 veces superior al promedio de la industria, ayudando a los creadores a iterar más rápido.
Replit celebrará Vibecon en Nueva York para explorar el código como medio creativo
La conferencia reunirá a Spike Jonze y otros creadores en junio para explorar la IA aplicada al código creativo como nuevo medio artístico.
Dos modelos de lenguaje pequeños de código abierto igualan el SOTA
Un desarrollador adelantó dos SLM de código abierto, uno de los cuales alcanza precisión de última generación siendo 93 veces más pequeño.
Guía Definitiva de Entornos RL encabeza tendencias en Hugging Face Spaces
Una guía sobre construcción y escalado de entornos de aprendizaje por refuerzo alcanzó el primer puesto en tendencias.
Higgsfield y Claude se unen para generación automática de anuncios DTC
La solución MCP genera automáticamente anuncios DTC en 40 estilos, sin errores de texto y con capacidad de escalado masivo.
MiniMax M2.7 permite una migración más fluida a través de LilacML
El modelo M2.7 ahora es más fácil de implementar y usar con la ayuda de LilacML, facilitando su adopción.
OpenAI celebra el éxito del evento parameter golf con más de 2.000 envíos
El evento comunitario atrajo más de 2.000 propuestas y más de 1.000 cuentas verificadas de GitHub, explorando técnicas de optimización de modelos.
Marionette: herramienta para crear movimientos robóticos mediante gestos
Herramienta de navegador que permite crear movimientos para el robot Reachy Mini mediante gestos desde el teléfono o la computadora.
Jeff Dean comparte iniciativa Open Defense de $5M para seguridad de código abierto
La iniciativa ofrece hasta 5 millones de dólares en créditos de laboratorio para proteger proyectos críticos de código abierto vinculados a la seguridad de la IA.
v0 añade modo de control de permisos para ejecución de comandos
Los usuarios pueden elegir entre preguntar siempre, decisión automática o acceso total antes de que el agente ejecute comandos.