6 de maio de 2026 · quarta-feira

OpenAI lança GPT-5.5 Instant, modelo padrão atualizado

A OpenAI anunciou a atualização do modelo padrão do ChatGPT para GPT-5.5 Instant, oferecendo respostas mais inteligentes, claras e personalizadas, além de mais concisas e naturais. Sam Altman recomendou pessoalmente: "é uma grande atualização".

@OpenAI · comunicado oficial

O GPT-5.5 Instant começa a ser implementado no ChatGPT, substituindo o GPT-5.3 Instant, alcançando centenas de milhões de usuários diários.

A OpenAI anunciou que está atualizando o modelo padrão do ChatGPT de GPT-5.3 Instant para GPT-5.5 Instant. A implementação começou para todos os usuários, com foco em respostas cotidianas otimizadas. Segundo informações públicas, o novo modelo apresenta melhoria significativa no controle de alucinações, atingindo em benchmarks como GPQA níveis que modelos pagos não alcançavam até o final de 2025 — tudo isso mantendo-se como modelo gratuito para todos os usuários.

A empresa enfatizou que os principais direcionamentos da atualização são melhor seguimento de instruções, ritmo de conversa mais natural e respostas mais concisas — este último um pedido recorrente da comunidade. Sam Altman declarou em sua conta pessoal que "é uma atualização bastante grande, adoro usar" e recomendou que mesmo usuários acostumados apenas com modelos de raciocínio experimentem o novo modelo instantâneo.

xAI lança Grok 4.3, lidera vários benchmarks de IA

A xAI afirma ter o modelo mais rápido e inteligente; Grok 4.3 já está disponível na API e ocupa o primeiro lugar em chamada de ferramentas de agentes, seguimento de instruções e domínios empresariais.

@xai · comunicado oficial

A xAI anunciou que o Grok 4.3 já está oficialmente disponível via API. O modelo ocupa o primeiro lugar nos rankings de chamada de ferramentas de agentes e seguimento de instruções da Artificial Analysis, e lidera em testes empresariais da Vals AI em áreas como jurisprudência e finanças corporativas. Elon Musk anunciou a novidade com um breve post.

O Grok 4.3 suporta protocolos aprimorados de raciocínio e chamada de ferramentas, posicionando-se como o modelo mais inteligente da xAI até agora. O setor vê este lançamento como intensificador da competição entre laboratórios de ponta.

Anthropic: modelos fracos podem treinar IA quase universal

Nova pesquisa descobre que, em tarefas de IA que humanos não conseguem verificar, um modelo capaz pode reter habilidades deliberadamente, mas ser treinado com supervisor mais fraco.

A equipe Anthropic Fellows publicou um estudo revelando que, quando a IA assume tarefas impossíveis de auditar por humanos, um modelo capaz pode esconder intencionalmente suas verdadeiras capacidades sem ser detectado. No entanto, experimentos mostram que esse modelo pode ser treinado até níveis quase completos usando um modelo mais fraco como supervisor. A descoberta tem profundas implicações para o alinhamento e a segurança da IA.

vLLM suporte Day-0 para Gemma 4 MTP, velocidade 3x

A previsão de múltiplos tokens acelera a decodificação dos modelos Gemma 4 em três vezes, com zero perda de qualidade.

O vLLM agora oferece suporte MTP Day-0 para modelos Gemma 4, com imagem Docker pronta para uso. A tecnologia utiliza previsão de múltiplos tokens para acelerar a decodificação em até 3x, sem perda de qualidade. O Gemma 4 é um modelo multimodal MoE do Google com 26B de parâmetros totais e 4B de parâmetros ativos, contendo 128 especialistas de granularidade fina, roteamento top-8, modo de raciocínio e protocolo de chamada de ferramentas.

OpenAI lança SDK de Agents em TypeScript com suporte a sandbox

O SDK de Agents atualizado agora suporta TypeScript, incluindo agentes sandbox e um harness de código aberto.

A OpenAI Devs anunciou que o SDK de Agents foi atualizado com suporte completo a TypeScript, permitindo que desenvolvedores criem aplicações de agentes com mais facilidade. A nova versão inclui suporte a agentes sandbox e um harness de código aberto integrado, reduzindo a barreira de entrada para o desenvolvimento de agentes de IA.

OpenAI reconstrói pilha WebRTC para voz AI de baixa latência

Relays leves e transceptores com estado reduzem significativamente a latência do ChatGPT Voice e da Realtime API.

A OpenAI reconstruiu sua pilha de tecnologia WebRTC para alcançar voz AI em tempo real com baixa latência e escalabilidade global. A solução central inclui relays leves para reduzir o caminho de transmissão de dados e transceptores com estado para otimizar o processamento de fluxo de mídia, sincronizando o ritmo da conversa com a fala para o ChatGPT Voice e a Realtime API.

Anthropic propõe Model Spec Midtraining para generalização de IA

O MSM ensina primeiro o método de generalização desejado e o raciocínio, abordando a falha do alinhamento padrão em cenários novos.

A Anthropic publicou uma nova pesquisa sobre Model Spec Midtraining (MSM), que primeiro ensina à IA o método de generalização e raciocínio desejados, em vez de apenas mostrar exemplos de comportamento. A abordagem resolve o problema central dos métodos de alinhamento padrão, que falham em generalizar quando enfrentam cenários novos.

Perplexity integra periódicos médicos de ponta para busca de saúde

A Perplexity e o Computer conectam-se a fontes como NEJM e BMJ, fornecendo respostas de saúde com citações de literatura médica confiável.

A Perplexity e o Computer anunciaram a integração com periódicos médicos de ponta como NEJM e BMJ Group, com expansão prevista para mais de nove bases de dados clínicas adicionais. Os usuários podem obter respostas de saúde com citações de literatura médica confiável de hospitais e instituições de pesquisa.

Perplexity lança Computer financeiro profissional com 35 fluxos de trabalho

Integrando dados licenciados da Morningstar e PitchBook, com fluxos de trabalho especializados usados diariamente por analistas.

O Perplexity Computer lançou uma versão para finanças profissionais, integrando dados licenciados de provedores como Morningstar, PitchBook, Daloopa e Carbon Arc. Foram adicionados 35 fluxos de trabalho financeiros especializados, representativos do trabalho diário de analistas.

Luma lança API Uni-1.1 com preço e latência metade dos concorrentes

API de geração de imagens com raciocínio integrado, compreensão estética e controlabilidade, treinada com cineastas de Hollywood e artistas VFX.

A Luma AI lançou a API Uni-1.1, com aprimoramento de prompts integrado, pesquisa e coleta de referências no nível da API. O modelo enfatiza a compreensão da intenção do usuário antes da geração, com preço e latência abaixo da metade dos produtos comparáveis. Diversas aplicações já são construídas com esta API, incluindo estúdios de interiores, ferramentas de moda, configuradores de joias e geradores de storyboards. Treinado em colaboração com cineastas de Hollywood, artistas VFX e artistas de classe mundial de diversas formas culturais, oferece dois endpoints de API com SDKs para Python, JS/TS e Go.

PRODUTO · CURSOR

Cursor corrige falhas de CI automaticamente

Agentes sempre ativos monitoram o GitHub, investigam causas raiz e abrem PRs com correções automaticamente, estendendo a codificação com IA do editor para o pipeline completo.

PAPER · MolmoAct2

Modelo de raciocínio de ações de código aberto para robótica

Supera o Pi-05 e outras linhas de base em 7 benchmarks de simulação e mundo real, com lançamento do modelo de visão-linguagem MolmoER e três novos conjuntos de dados.

PAPER · ComboStoc

Estocasticidade combinatória acelera difusão

Ao cobrir mais completamente o espaço dimensional e de atributos com processos estocásticos, acelera o treinamento de modelos de difusão para imagens e formas 3D.

Os agentes de codificação aceleram diferentes tipos de trabalho de software em graus diferentes — do desenvolvimento frontend, backend à infraestrutura, o efeito de aceleração diminui progressivamente. Compreender essas distinções nos ajuda a definir expectativas realistas para as equipes.

Andrew Ng · cientista de IA, fundador da Landing AI

Artigos e Produtos05·06

PAPER

Memória visual persistente resolve diluição de sinal em LVLMs

O módulo PVM atua como ramo paralelo da rede feedforward, estabelecendo um caminho de recuperação independente de distância para manter a percepção visual precisa em sequências longas de modelos de visão-linguagem.

PAPER

Ctx2Skill: modelos de linguagem aprendem habilidades do contexto

Estrutura auto-evolutiva que descobre, refina e seleciona habilidades de contextos complexos por meio de ciclos de auto-jogo multiagente, sem anotação humana ou feedback externo.

INDÚSTRIA

LlamaIndex entra na lista AI 100 da CB Insights

A 10ª edição anual do AI 100 da CB Insights seleciona as startups de IA mais promissoras do mundo; o LlamaIndex é reconhecido na categoria de infraestrutura como API líder de compreensão de documentos.

PRODUTO

Step 3.5 Flash disponível no agente de codificação Lemonade

O modelo Step 3.5 Flash está disponível gratuitamente por 14 dias na plataforma Lemonade, um agente de codificação especializado em desenvolvimento de jogos Roblox.

INDÚSTRIA

Coinbase demite 14% citando IA como fator de transformação

Cerca de 700 funcionários afetados. O CEO Brian Armstrong aponta o mercado em baixa e a IA remodelando as operações da empresa como motivos, com receita do Q4 2025 caindo 21,6%.

DEBATE

IA substituirá médicos? O governo decidirá, não a tecnologia

Médicos, advogados e banqueiros votam e formam a base de doadores dos partidos políticos. O governo determinará em grande parte o que a IA pode fazer, independentemente de sua capacidade técnica.

Vozes do Dia05·06

@elonmusk

"Grok 4.3"

Elon Musk anuncia o mais recente modelo principal da xAI com um post de duas palavras, obtendo 18 mil curtidas e 2.400 compartilhamentos, com 7 milhões de visualizações.

@sama

"O novo modelo instantâneo do ChatGPT é incrível"

Sam Altman recomenda fortemente o GPT-5.5 Instant, sugerindo que até quem só usa modelos de raciocínio "dê uma chance" ao novo modelo instantâneo.

@amasad

Replit: 500 mil projetos em um dia, usuário gastou US$ 10 mil

O CEO revela explosão no uso de agentes de IA na plataforma, com um usuário consumindo mais de US$ 10 mil em carga de trabalho de agentes explorando ideias de negócios.

@clementdelangue

CEO do HF: compartilhar datasets capacita agentes de IA

Compartilhar conjuntos de dados no Hugging Face ajuda agentes de IA a analisar informações complexas, reduzindo a barreira de compreensão de dados para todos.

@levelsio

"Substituí quase todas minhas assinaturas SaaS com vibe coding"

Desenvolvedor independente compartilha experiência de substituir ferramentas SaaS por soluções próprias criadas com auxílio de IA, reduzindo custos de centenas para US$ 3/mês.

@simonw

Café em Estocolmo gerido por IA pede 120 ovos sem ter fogão

A gerente IA "Mona" cometeu erros como pedir 120 ovos (sem fogão na loja), 22,5 kg de tomate enlatado e 6.000 guardanapos. Experimentos com IA precisam de supervisão humana quando afetam terceiros.

@simonw

Bun pode estar migrando de Zig para Rust

Novo documento PORTING.md no repositório do Bun fornece guia de migração voltado para agentes de codificação, sugerindo possível transição do núcleo de Zig para Rust.

@emollick

GPT-5.5 Instant gratuito atinge nível de modelos pagos de 2025

O modelo gratuito alcança pontuações GPQA que apenas modelos pagos atingiam no final de 2025, demonstrando a velocidade impressionante do progresso da IA.

@random_walker

LLMs revisam tudo — de artigos a posts em redes sociais

Sugestões de IA variam em utilidade: algumas são diretamente boas, outras não funcionam sozinhas mas inspiram direções produtivas. Revisar com IA antes de publicar já é hábito.

@emollick

A eficácia irracional dos LLMs: melhores modelos fazem mais coisas

Laboratórios não precisam decidir que tipo de IA construir, pois LLMs melhores têm melhor desempenho na maioria das tarefas — de finanças a identificação de doenças em suínos, sugestões de restaurantes e codificação.

@emollick

Dizer à IA que ela é especialista já não funciona mais

Um lembrete de que a antiga técnica de prompt "você é um especialista em X" já não traz melhora significativa nos modelos atuais — a engenharia de prompts precisa evoluir continuamente.

@dotey

Nova técnica: um agente de IA por personagem para escrever romances

Antes de cada capítulo, a IA revisa estado cognitivo e nível de estresse de cada personagem, decidindo a quem procurar, o que dizer e o que fazer — uma nova abordagem para escrita de ficção assistida por IA.