xAI lança Grok 4.3, lidera vários benchmarks de IA
A xAI afirma ter o modelo mais rápido e inteligente; Grok 4.3 já está disponível na API e ocupa o primeiro lugar em chamada de ferramentas de agentes, seguimento de instruções e domínios empresariais.
A xAI anunciou que o Grok 4.3 já está oficialmente disponível via API. O modelo ocupa o primeiro lugar nos rankings de chamada de ferramentas de agentes e seguimento de instruções da Artificial Analysis, e lidera em testes empresariais da Vals AI em áreas como jurisprudência e finanças corporativas. Elon Musk anunciou a novidade com um breve post.
O Grok 4.3 suporta protocolos aprimorados de raciocínio e chamada de ferramentas, posicionando-se como o modelo mais inteligente da xAI até agora. O setor vê este lançamento como intensificador da competição entre laboratórios de ponta.
Anthropic: modelos fracos podem treinar IA quase universal
Nova pesquisa descobre que, em tarefas de IA que humanos não conseguem verificar, um modelo capaz pode reter habilidades deliberadamente, mas ser treinado com supervisor mais fraco.
A equipe Anthropic Fellows publicou um estudo revelando que, quando a IA assume tarefas impossíveis de auditar por humanos, um modelo capaz pode esconder intencionalmente suas verdadeiras capacidades sem ser detectado. No entanto, experimentos mostram que esse modelo pode ser treinado até níveis quase completos usando um modelo mais fraco como supervisor. A descoberta tem profundas implicações para o alinhamento e a segurança da IA.
vLLM suporte Day-0 para Gemma 4 MTP, velocidade 3x
A previsão de múltiplos tokens acelera a decodificação dos modelos Gemma 4 em três vezes, com zero perda de qualidade.
O vLLM agora oferece suporte MTP Day-0 para modelos Gemma 4, com imagem Docker pronta para uso. A tecnologia utiliza previsão de múltiplos tokens para acelerar a decodificação em até 3x, sem perda de qualidade. O Gemma 4 é um modelo multimodal MoE do Google com 26B de parâmetros totais e 4B de parâmetros ativos, contendo 128 especialistas de granularidade fina, roteamento top-8, modo de raciocínio e protocolo de chamada de ferramentas.
OpenAI lança SDK de Agents em TypeScript com suporte a sandbox
O SDK de Agents atualizado agora suporta TypeScript, incluindo agentes sandbox e um harness de código aberto.
A OpenAI Devs anunciou que o SDK de Agents foi atualizado com suporte completo a TypeScript, permitindo que desenvolvedores criem aplicações de agentes com mais facilidade. A nova versão inclui suporte a agentes sandbox e um harness de código aberto integrado, reduzindo a barreira de entrada para o desenvolvimento de agentes de IA.
OpenAI reconstrói pilha WebRTC para voz AI de baixa latência
Relays leves e transceptores com estado reduzem significativamente a latência do ChatGPT Voice e da Realtime API.
A OpenAI reconstruiu sua pilha de tecnologia WebRTC para alcançar voz AI em tempo real com baixa latência e escalabilidade global. A solução central inclui relays leves para reduzir o caminho de transmissão de dados e transceptores com estado para otimizar o processamento de fluxo de mídia, sincronizando o ritmo da conversa com a fala para o ChatGPT Voice e a Realtime API.
Anthropic propõe Model Spec Midtraining para generalização de IA
O MSM ensina primeiro o método de generalização desejado e o raciocínio, abordando a falha do alinhamento padrão em cenários novos.
A Anthropic publicou uma nova pesquisa sobre Model Spec Midtraining (MSM), que primeiro ensina à IA o método de generalização e raciocínio desejados, em vez de apenas mostrar exemplos de comportamento. A abordagem resolve o problema central dos métodos de alinhamento padrão, que falham em generalizar quando enfrentam cenários novos.
Perplexity integra periódicos médicos de ponta para busca de saúde
A Perplexity e o Computer conectam-se a fontes como NEJM e BMJ, fornecendo respostas de saúde com citações de literatura médica confiável.
A Perplexity e o Computer anunciaram a integração com periódicos médicos de ponta como NEJM e BMJ Group, com expansão prevista para mais de nove bases de dados clínicas adicionais. Os usuários podem obter respostas de saúde com citações de literatura médica confiável de hospitais e instituições de pesquisa.
Perplexity lança Computer financeiro profissional com 35 fluxos de trabalho
Integrando dados licenciados da Morningstar e PitchBook, com fluxos de trabalho especializados usados diariamente por analistas.
O Perplexity Computer lançou uma versão para finanças profissionais, integrando dados licenciados de provedores como Morningstar, PitchBook, Daloopa e Carbon Arc. Foram adicionados 35 fluxos de trabalho financeiros especializados, representativos do trabalho diário de analistas.
Luma lança API Uni-1.1 com preço e latência metade dos concorrentes
API de geração de imagens com raciocínio integrado, compreensão estética e controlabilidade, treinada com cineastas de Hollywood e artistas VFX.
A Luma AI lançou a API Uni-1.1, com aprimoramento de prompts integrado, pesquisa e coleta de referências no nível da API. O modelo enfatiza a compreensão da intenção do usuário antes da geração, com preço e latência abaixo da metade dos produtos comparáveis. Diversas aplicações já são construídas com esta API, incluindo estúdios de interiores, ferramentas de moda, configuradores de joias e geradores de storyboards. Treinado em colaboração com cineastas de Hollywood, artistas VFX e artistas de classe mundial de diversas formas culturais, oferece dois endpoints de API com SDKs para Python, JS/TS e Go.
Cursor corrige falhas de CI automaticamente
Agentes sempre ativos monitoram o GitHub, investigam causas raiz e abrem PRs com correções automaticamente, estendendo a codificação com IA do editor para o pipeline completo.
Modelo de raciocínio de ações de código aberto para robótica
Supera o Pi-05 e outras linhas de base em 7 benchmarks de simulação e mundo real, com lançamento do modelo de visão-linguagem MolmoER e três novos conjuntos de dados.
Estocasticidade combinatória acelera difusão
Ao cobrir mais completamente o espaço dimensional e de atributos com processos estocásticos, acelera o treinamento de modelos de difusão para imagens e formas 3D.
Os agentes de codificação aceleram diferentes tipos de trabalho de software em graus diferentes — do desenvolvimento frontend, backend à infraestrutura, o efeito de aceleração diminui progressivamente. Compreender essas distinções nos ajuda a definir expectativas realistas para as equipes.
Memória visual persistente resolve diluição de sinal em LVLMs
O módulo PVM atua como ramo paralelo da rede feedforward, estabelecendo um caminho de recuperação independente de distância para manter a percepção visual precisa em sequências longas de modelos de visão-linguagem.
Ctx2Skill: modelos de linguagem aprendem habilidades do contexto
Estrutura auto-evolutiva que descobre, refina e seleciona habilidades de contextos complexos por meio de ciclos de auto-jogo multiagente, sem anotação humana ou feedback externo.
LlamaIndex entra na lista AI 100 da CB Insights
A 10ª edição anual do AI 100 da CB Insights seleciona as startups de IA mais promissoras do mundo; o LlamaIndex é reconhecido na categoria de infraestrutura como API líder de compreensão de documentos.
Step 3.5 Flash disponível no agente de codificação Lemonade
O modelo Step 3.5 Flash está disponível gratuitamente por 14 dias na plataforma Lemonade, um agente de codificação especializado em desenvolvimento de jogos Roblox.
Coinbase demite 14% citando IA como fator de transformação
Cerca de 700 funcionários afetados. O CEO Brian Armstrong aponta o mercado em baixa e a IA remodelando as operações da empresa como motivos, com receita do Q4 2025 caindo 21,6%.
IA substituirá médicos? O governo decidirá, não a tecnologia
Médicos, advogados e banqueiros votam e formam a base de doadores dos partidos políticos. O governo determinará em grande parte o que a IA pode fazer, independentemente de sua capacidade técnica.
"Grok 4.3"
Elon Musk anuncia o mais recente modelo principal da xAI com um post de duas palavras, obtendo 18 mil curtidas e 2.400 compartilhamentos, com 7 milhões de visualizações.
"O novo modelo instantâneo do ChatGPT é incrível"
Sam Altman recomenda fortemente o GPT-5.5 Instant, sugerindo que até quem só usa modelos de raciocínio "dê uma chance" ao novo modelo instantâneo.
Replit: 500 mil projetos em um dia, usuário gastou US$ 10 mil
O CEO revela explosão no uso de agentes de IA na plataforma, com um usuário consumindo mais de US$ 10 mil em carga de trabalho de agentes explorando ideias de negócios.
CEO do HF: compartilhar datasets capacita agentes de IA
Compartilhar conjuntos de dados no Hugging Face ajuda agentes de IA a analisar informações complexas, reduzindo a barreira de compreensão de dados para todos.
"Substituí quase todas minhas assinaturas SaaS com vibe coding"
Desenvolvedor independente compartilha experiência de substituir ferramentas SaaS por soluções próprias criadas com auxílio de IA, reduzindo custos de centenas para US$ 3/mês.
Café em Estocolmo gerido por IA pede 120 ovos sem ter fogão
A gerente IA "Mona" cometeu erros como pedir 120 ovos (sem fogão na loja), 22,5 kg de tomate enlatado e 6.000 guardanapos. Experimentos com IA precisam de supervisão humana quando afetam terceiros.
Bun pode estar migrando de Zig para Rust
Novo documento PORTING.md no repositório do Bun fornece guia de migração voltado para agentes de codificação, sugerindo possível transição do núcleo de Zig para Rust.
GPT-5.5 Instant gratuito atinge nível de modelos pagos de 2025
O modelo gratuito alcança pontuações GPQA que apenas modelos pagos atingiam no final de 2025, demonstrando a velocidade impressionante do progresso da IA.
LLMs revisam tudo — de artigos a posts em redes sociais
Sugestões de IA variam em utilidade: algumas são diretamente boas, outras não funcionam sozinhas mas inspiram direções produtivas. Revisar com IA antes de publicar já é hábito.
A eficácia irracional dos LLMs: melhores modelos fazem mais coisas
Laboratórios não precisam decidir que tipo de IA construir, pois LLMs melhores têm melhor desempenho na maioria das tarefas — de finanças a identificação de doenças em suínos, sugestões de restaurantes e codificação.
Dizer à IA que ela é especialista já não funciona mais
Um lembrete de que a antiga técnica de prompt "você é um especialista em X" já não traz melhora significativa nos modelos atuais — a engenharia de prompts precisa evoluir continuamente.
Nova técnica: um agente de IA por personagem para escrever romances
Antes de cada capítulo, a IA revisa estado cognitivo e nível de estresse de cada personagem, decidindo a quem procurar, o que dizer e o que fazer — uma nova abordagem para escrita de ficção assistida por IA.