12 de maio de 2026 · terça-feira



"Você não sentiu o progresso da IA se apenas usou agentes individuais. O salto está nos agentes massivamente paralelos, orquestrados corretamente e que se fundem sem atritos."

— Amjad Masad, CEO da Replit

PESQUISA

Novo artigo propõe framework de otimização recursiva de agentes

A equipe de Graham Neubig lança o Recursive Agent Optimization, permitindo que agentes aprendam a delegar subtarefas a outros agentes de forma robusta.

INDÚSTRIA

IA local de código aberto ultrapassa Lei de Moore em mais de 2x

Clement Delangue compara dois anos de hardware de MacBook inalterado e observa que a inteligência dos modelos locais de código aberto melhorou mais que o dobro da velocidade prevista pela Lei de Moore.

MODELOS

Microsoft lança Phi-Ground-Any: 4B alcança estado da arte em localização de GUI

A Microsoft liberou o código aberto do Phi-Ground-Any no Hugging Face, um modelo de visão de 4 bilhões de parâmetros que alcança o estado da arte em tarefas de localização de elementos de interface gráfica.

LIDERANÇA

Sam Altman: IA transformará a cibersegurança

O CEO da OpenAI afirma que a IA está prestes a se tornar extremamente poderosa em cibersegurança e espera colaborar com mais empresas para reforçar software continuamente.

ANÁLISE

Das ambições do Codex ao MCP/Skills: competição de ferramentas de codificação IA se desloca

Artigo analisa que a competição entre ferramentas como Codex, Cursor e Claude passou da força dos modelos para a camada de experiência e capacidades agentivas, com foco na experiência do lado direito da tela.

PESQUISA

Artigo prova que modelos podem ser otimizados para variação criativa

Ethan Mollick apresenta nova pesquisa que rompe o gargalo da homogeneidade nas saídas de modelos de IA, mostrando que a criatividade pode ser otimizada especificamente para cada contexto.


Produtos & Agentes 12 de maio
CURSOR

Cursor integra com Microsoft Teams para delegar tarefas nos canais

O assistente de codificação Cursor AI adiciona integração com Teams; usuários podem delegar tarefas a agentes via @Cursor ou extrair informações diretamente do Cursor para a equipe.

REPLIT

Replit lança agentes paralelos: até 10 agentes para acelerar builds

O Replit apresenta Parallel Agents, permitindo que até 10 agentes trabalhem simultaneamente e depois unifiquem os resultados, acelerando dramaticamente o ciclo de desenvolvimento.

OPENAI

GPT-Realtime-2 automatiza tarefas de quadro de projeto

Demonstração exibe o GPT-Realtime-2 compreendendo reuniões em pé e movendo tickets de tarefas, ilustrando o potencial da IA de voz em tempo real na colaboração de desenvolvimento.

CODEX

Codex adiciona plugin OpenAI Developers para acelerar apps de IA

O Codex integra o plugin OpenAI Developers, ajudando os desenvolvedores a invocar as APIs da OpenAI mais rapidamente para construir aplicações e agentes de IA.

CLAUDE

Claude Code lança Agent View: gerencie múltiplas sessões em paralelo

O Agent View permite que os desenvolvedores controlem todas as sessões paralelas de IA em uma única interface, reduzindo a carga cognitiva e aumentando a eficiência multitarefa.

CURSOR

Cursor Bugbot oferece profundidade de revisão de PR personalizada

O Cursor permite que as equipes definam a profundidade de análise do Bugbot de acordo com a importância do PR, adequado para cenários críticos como infraestrutura e backend.


Modelos & Infraestrutura
VLLM

vLLM lidera ranking do Artificial Analysis com implantação open-source

O vLLM vence o benchmark do Artificial Analysis; as melhores implantações de modelos como DeepSeek V3.2 usam a solução de código aberto.

BFL

BFL vislumbra modelos generativos que compreendem mundos, movimento e interação

A Black Forest Labs compartilha sua direção de pesquisa: os modelos evoluirão da geração de imagens para a inteligência visual em tempo real.

TENCENT

Prévia do Hunyuan Hy3 foca em tarefas complexas de agentes

A Tencent Hunyuan mostra uma prévia do modelo Hy3, demonstrando sua capacidade de lidar com tarefas complexas de múltiplas etapas.

RED HAT

Red Hat avalia quantização TurboQuant do vLLM com 4 modelos e 5 benchmarks

A equipe de IA da Red Hat testa TurboQuant FP8 no vLLM 0.20.2, com tarefas de contexto longo e raciocínio.

PAPER

OBLIQ-Bench no arXiv incentiva uso de benchmarks modernos

Nelson Liu espera reduzir o número de artigos de agentes de busca baseados em conjuntos de dados desatualizados como o MS MARCO.

BENCHMARK

Resultados de benchmark de engenharia de software com múltiplos modelos são divulgados

A equipe de Graham Neubig publica a avaliação de novos modelos em cinco tarefas de engenharia de software para apoiar a escolha.

FINANCIAMENTO

Consensus NLP capta US$ 30M para sistema operacional de IA para pesquisa

A Consensus anuncia US$ 30 milhões em novo financiamento; 2,5 milhões de pesquisadores já usam sua plataforma.

VIDU

Atualização Vidu Q3 dobra a velocidade de geração de vídeo

O Vidu Q3 reduz drasticamente o tempo de geração de vídeo 1080p de 10 segundos com otimizações abrangentes de velocidade.


Vozes & Tendências
OPENAI

Sam Altman: novo ChatGPT traz mudança qualitativa com personalização

Sam Altman afirma que o novo modelo ChatGPT, aliado à personalização e customização, atingiu um ponto de inflexão na experiência do usuário, descrevendo-o como algo qualitativamente diferente do que existia antes.

DICA

Karpathy: faça os LLMs gerarem HTML e exibir no navegador

Andrej Karpathy compartilhou uma dica de prompt para fazer com que os LLMs estruturem a saída como HTML, mencionando usos como exibição em slides e outras formas visuais de apresentação.

OPINIÃO

Greg Brockman: agentes são um produto surpreendentemente ótimo

O cofundador da OpenAI observa que os agentes de IA se revelaram um formato de produto excepcionalmente eficaz, superando as expectativas em termos de utilidade prática.

ADOBE

Adobe Firefly adota modelos FLUX para conteúdo visual multidisciplinar

O Adobe Firefly introduz a família de modelos FLUX, permitindo que designers, profissionais de marketing e educadores produzam imagens de alta qualidade consistentes com a marca.

LLAMAINDEX

sandboxed-lit: agente Rust para leitura e escrita segura de documentos

O LlamaIndex lança um agente CLI baseado em Rust que combina o LiteParse e um sandbox de segurança para lidar com arquivos complexos como PDFs, imagens e documentos do Office.

HUGGING FACE

Hugging Face integra o agente Hermes em aplicativos locais

O Hugging Face adiciona o agente Hermes aos aplicativos locais, com suporte a modelos locais compatíveis com GGUF e MLX, fortalecendo o ecossistema de IA local e offline.