8 de mayo de 2026 · viernes

OpenAI lanza GPT-Realtime-2, modelo de voz con razonamiento de nivel GPT-5

OpenAI presentó GPT-Realtime-2 en su API, su modelo de voz más inteligente con razonamiento de nivel GPT-5 para resolver problemas complejos en tiempo real.

GPT-Realtime-2 ya está disponible en la API de OpenAI para agentes de voz.

OpenAI lanzó GPT-Realtime-2 en su API, describiéndolo como su modelo de voz más inteligente hasta la fecha. El nuevo modelo incorpora capacidades de razonamiento de nivel GPT-5, lo que permite que los agentes de voz actúen como colaboradores en tiempo real que pueden escuchar, razonar y resolver problemas complejos a medida que se desarrollan las conversaciones. Las aplicaciones van desde la atención al cliente hasta la traducción en vivo, pasando por asistentes de productividad que entienden el contexto completo de una conversación larga. Sam Altman, CEO de OpenAI, calificó el lanzamiento como "un gran paso adelante" y señaló que cada vez más personas están usando la voz para interactuar con la inteligencia artificial.

Estudio de Anthropic: Autoencoder de lenguaje natural traduce activaciones internas del modelo

Anthropic entrenó a Claude para traducir sus activaciones numéricas internas a texto legible, proporcionando una nueva herramienta de interpretabilidad.

Modelos como Claude hablan en palabras pero piensan en números. Las activaciones —los valores numéricos que codifican los pensamientos del modelo— no son legibles directamente por humanos. El nuevo autoencoder de lenguaje natural de Anthropic resuelve este problema: entrena a Claude para traducir sus propias activaciones internas en texto comprensible. Esta técnica ofrece una ventana sin precedentes a la caja negra de los modelos de lenguaje, permitiendo a los investigadores entender qué está ocurriendo realmente dentro del modelo durante el razonamiento. El avance podría acelerar los esfuerzos de alineación y seguridad al hacer que los procesos internos de la IA sean más transparentes y auditables.

OpenAI Codex llega a Chrome con ejecución paralela en segundo plano

El agente de programación Codex ahora funciona directamente en el navegador, ejecutando tareas en múltiples pestañas sin ocupar la interfaz del usuario.

OpenAI lanzó una extensión de Chrome que permite a Codex operar directamente en el navegador en macOS y Windows. El agente puede probar aplicaciones web, recopilar contexto a través de pestañas y utilizar las DevTools del navegador de forma eficiente, todo en paralelo y en segundo plano. Los ingenieros pueden delegar flujos de trabajo completos de desarrollo web mientras siguen usando el navegador con normalidad.

xAI lanza Modo de Calidad de Imagen en su API, más de 300 millones de imágenes generadas

xAI presentó el Modo de Calidad de Generación de Imágenes en su API, mejorando el fotorrealismo y la representación de texto, con más de 300 millones de imágenes ya generadas en Grok.

Perplexity lanza Personal Computer para Mac, capaz de operar archivos y aplicaciones locales

El Personal Computer de Perplexity ya está disponible a través de una nueva aplicación para Mac. Permite ejecutar tareas en archivos locales, aplicaciones nativas de Mac, la web y los servidores seguros de Perplexity, todo desde una interfaz unificada.

Cursor lanza /orchestrate: agentes recursivos para tareas complejas

La nueva habilidad /orchestrate de Cursor genera agentes recursivamente para abordar tareas ambiciosas. El equipo la ha usado internamente para automatizar investigación con una reducción del 20% en uso de tokens y para reducir el tiempo de arranque en frío del backend en un 80%.

La gente realmente está empezando a usar la voz para interactuar con la IA, especialmente cuando tienen mucho contexto que transmitir.
Sam Altman, CEO de OpenAI

Zhipu publica el informe técnico de GLM-5V-Turbo, modelo base nativo para agentes multimodales

El informe resume las principales mejoras en diseño de modelos, entrenamiento multimodal, aprendizaje por refuerzo, expansión de la cadena de herramientas e integración con marcos de agentes. GLM-5V-Turbo apunta a ser un modelo de base nativo para la próxima generación de agentes multimodales.

PhysForge: nuevo marco para generar activos 3D físicamente interactivos

PhysForge propone un marco desacoplado de dos etapas que utiliza planificación de planos físicos y modelos de difusión guiados por física para generar activos 3D funcionales y listos para simulación. El artículo fue aceptado en ICML 2026.

RLDX-1: política robótica con 86,8% de éxito en manipulación diestra

Basado en una arquitectura Transformer de acción multi-flujo, RLDX-1 logra una tasa de éxito del 86,8% en tareas del robot humanoide ALLEX, superando ampliamente a otros modelos que rondan el 40%.

Anthropic integra Claude completamente en Microsoft 365

Los complementos de Claude para Excel, PowerPoint y Word pasan de beta a disponibilidad general. El complemento de Outlook entra en beta pública. Esto permite invocar a Claude directamente desde documentos, hojas de cálculo y correos electrónicos sin salir del entorno de Office.

Anthropic dona la herramienta de alineación Petri a una organización sin fines de lucro

Anthropic donó su herramienta de alineación de código abierto Petri a Meridian Labs para garantizar su desarrollo independiente. Se publicó una actualización importante que mejora la adaptabilidad, el realismo y la profundidad de las pruebas de seguridad en modelos de lenguaje.

Análisis y reportajes08.05.2026

SEGURIDAD

Mozilla verifica el rendimiento de Claude Mythos en el fortalecimiento de Firefox

Mozilla utilizó la versión preliminar de Claude Mythos en el fortalecimiento de seguridad de Firefox. El modelo demostró no ser una exageración de marketing, encontrando vulnerabilidades reales y descartando falsos positivos con precisión. Se espera que capacidades similares lleguen a modelos de OpenAI, Google y proyectos de código abierto en los próximos meses.

INVESTIGACIÓN

El Instituto TAI de Anthropic define su agenda en cuatro áreas estratégicas

El Anthropic Institute (TAI) enfocará su investigación en difusión económica de la IA, amenazas y resiliencia, sistemas de IA en entornos reales e I+D impulsada por inteligencia artificial. El instituto se compromete a compartir públicamente sus hallazgos sobre el impacto social de la IA.

INFRAESTRUCTURA

Detalles del acuerdo de centros de datos entre xAI y Anthropic

Anthropic obtiene el centro de datos Colossus 1, mientras xAI conserva el más grande Colossus 2. Colossus 1 tiene un historial ambiental muy deficiente: sus turbinas de gas operaron sin permisos. xAI cerró varios modelos antiguos con solo dos semanas de aviso.

GOBERNANZA

Se revelan los mensajes internos de la noche del golpe en OpenAI

En el juicio de Elon Musk contra OpenAI, el testimonio en video de la ex CTO Mira Murati y los mensajes internos de noviembre de 2023 se hicieron públicos por primera vez. Las comunicaciones reconstruyen una de las luchas de poder más dramáticas en la historia de Silicon Valley.

En breveActualidad

GUÍA

OpenAI publica guía de prompting para GPT-Realtime-2

Cubre ajuste de razonamiento, diseño de preámbulos, configuración de herramientas y manejo de sesiones largas.

AGENTES

AlphaEvolve de Google DeepMind acelera la investigación cuántica y biotecnológica

El agente de codificación impulsado por Gemini ha acelerado avances en física cuántica, biotecnología y logística.

VOZ

xAI presenta Grok Voice Think Fast 1.0 para atención al cliente

Diseñado para entornos reales, maneja flujos complejos incluso en condiciones de audio difíciles.

EDUCACIÓN

Andrew Ng lanza curso sobre agentes que generan interfaces de usuario personalizadas

El curso enseña a construir agentes que responden con gráficos, formularios y pizarras generados bajo demanda.

HERRAMIENTAS

OpenAI lanza la herramienta CLI oficial openai-cli

Código abierto en GitHub bajo licencia Apache 2.0, permite llamar a la API directamente desde la terminal.

CRECIMIENTO

El uso de tokens de Tencent Hy3 se multiplica por 10

Impulsado por cargas de trabajo de codificación y agentes, con crecimiento interno de 16,5x en productos propios.

SEGURIDAD

Anthropic abre públicamente su programa de recompensas por fallos

El programa, ahora en HackerOne, permite a cualquier persona reportar vulnerabilidades y recibir recompensas.

ENERGÍA

NVIDIA se compromete al 100% con el proyecto Genesis de supercomputación

Ian Buck afirma que la IA ayudará a construir la energía que necesita, destacando dos décadas de colaboración con laboratorios nacionales.