5 de maio de 2026 · terça-feira

PRODUTO

xAI lança recurso de clonagem de voz do Grok Voice API

A xAI lança um recurso de clonagem de voz para o Grok Voice API, permitindo clonar voz com emoções naturais a partir de gravações curtas e gerenciar bibliotecas de voz via console para personalização de voz da marca.

Duas vozes. Uma humana. Uma IA. Clonagem de voz com emoção natural já disponível na Grok Voice API.

Duas vozes. Uma humana. Uma IA. A clonagem de voz com emoções naturais já está disponível na Grok Voice API. Os usuários podem clonar vozes a partir de gravações curtas e gerenciar bibliotecas de voz através do console da xAI, abrindo experiências de voz personalizadas para marcas e desenvolvedores. O recurso suporta inflexão emocional natural, tornando as vozes clonadas indistinguíveis da fala humana em conversação.

PRODUTO

Ollama suporta Claude Desktop, permitindo inferência de terceiros

O Ollama agora suporta todos os modelos do Ollama Cloud, incluindo Claude Cowork e Claude Code, através do recurso de inferência de terceiros integrado do Claude Desktop.

Todos os modelos do Ollama Cloud agora podem ser usados no Claude Cowork e Claude Code a partir do Claude Desktop.

O Ollama agora suporta o Claude Desktop via inferência de terceiros integrada. A integração permite que todos os modelos do Ollama Cloud sejam usados no Claude Cowork e Claude Code diretamente do aplicativo Claude Desktop. Isso conecta modelos open-source auto-hospedados com ferramentas de codificação de IA de ponta, oferecendo aos desenvolvedores um caminho integrado para aproveitar modelos locais dentro do ecossistema da Anthropic.

Precisamos criar um novo termo para os ataques que alguns laboratórios chineses estão fazendo em APIs, diferente de destilação, ou corremos o risco de manchar uma técnica crucial para a difusão da IA, a pesquisa acadêmica e o ecossistema open-source.

Nathan Lambert, interconnects.ai
O Perplexity Computer agora está disponível dentro do espaço de trabalho do Microsoft Teams.
PRODUTO

Perplexity Computer integra-se ao Microsoft Teams

O Perplexity Computer agora está disponível no Microsoft Teams, permitindo realizar pesquisas, análises e criação de documentos diretamente no espaço de trabalho do Teams com as mesmas capacidades do produto independente Computer.

O Luma Agents transforma conceitos criativos em sistemas de anúncios completos de forma automática.
PRODUTO

Luma lança agente criativo que automatiza ideias em sistemas de anúncios completos

O Luma Agents pode concluir automaticamente todo o processo, do planejamento e geração à otimização iterativa em torno de conceitos definidos pelo usuário, transformando ideias criativas em sistemas de anúncios completos.

HARDWARE

Desempenho do GB300 Ultra NVL72 vaza: 2,7x mais rápido que o GB200

A SemiAnalysis relata que o GB300 Ultra NVL72 é 2,7 vezes mais rápido que o GB200 NVL72 em benchmarks de inferência padrão da indústria, um salto significativo de desempenho que marca uma nova geração em hardware de treinamento e inferência de IA.

PESQUISA

DeepSeek-V4: atenção mista + MoE esparsa reduz cache KV em 90%, suporta contexto de um milhão de tokens

O DeepSeek-V4 usa uma arquitetura de atenção mista e MoE esparsa, reduzindo o cache KV em até 90% para suportar um comprimento de contexto de um milhão de tokens, mantendo a eficiência de inferência.

INDÚSTRIA

NVIDIA compara IA a um bolo de cinco camadas: energia, chips, infraestrutura, modelos e apps

A NVIDIA descreve a infraestrutura de IA como cinco camadas interdependentes: energia, chips, infraestrutura, modelos e aplicações. Os países e empresas que construírem a pilha completa definirão a próxima era industrial.

LANÇAMENTO DE MODELO

IBM Granite 4.1-8B lançado, otimizado para hardware com 8–16GB de VRAM

O modelo IBM Granite 4.1-8B foi disponibilizado como código aberto no Hugging Face, especificamente otimizado para hardware com 8 a 16GB de VRAM, ampliando a fronteira da IA open-source acessível para desenvolvedores.

Inovações em Agentes & Modelos 05.05

O cofundador da Anthropic, Jack Clark, atribui 60% de probabilidade à RSI até o final de 2028.

via @goodside
Comunidade & Notas Breves 05.05
EDUCAÇÃO

Plataforma multimodal com IA para alunos surdos

O CEO do Replit, Amjad Masad, destaca uma plataforma de aprendizagem multimodal com IA criada especificamente para alunos surdos.

REPLIT

Maior paralelismo agentivo da internet acontece no Replit

Amjad Masad observa que o Replit hospeda mais atividade de desenvolvimento agentivo paralelo do que qualquer outra plataforma: 10 ativos, 198 em rascunho, mais de 700 concluídos.

FERRAMENTA

Visualizador de modelos do Hugging Face explora qualquer arquitetura

Uma nova ferramenta da comunidade visualiza arquiteturas de modelos do Hugging Face em qualquer granularidade, bastando inserir a URL do modelo, com suporte a comparação entre modelos.

ARTIGOS

Melhores artigos: sistemas multi-agente recursivos e modelagem de mundo

O Hugging Papers destaca as melhores pesquisas da semana sobre sistemas multi-agente recursivos, modelagem de mundo agentiva e estruturas organizacionais de IA.

ARTIGO

UniVidX: framework multimodal para geração de vídeo por difusão

O UniVidX propõe um framework multimodal unificado que utiliza priors de difusão, alcançando SOTA em tarefas de composição de camadas RGB e RGBA.

TENDÊNCIAS

Modelos da DeepSeek, Xiaomi e OpenAI em destaque no Hugging Face

Os modelos open-source em destaque no Hugging Face incluem lançamentos da DeepSeek, Xiaomi, OpenAI, Mistral AI e AI Pool, refletindo um cenário open-source diversificado.

OPINIÃO

Software é um cache de agentes

Uma tese provocadora: o software tradicional é essencialmente um cache de fluxos de trabalho de agentes comprovados, cristalizando processos confiáveis de múltiplas etapas em lógica determinística.

PESQUISA

Gradientes de Transformers são esparsos — baixo rank justificado

Uma investigação sobre gradientes de Transformers revela que são esparsos em certas dimensões, validando métodos de aproximação de baixo rank para treinamento e fine-tuning eficientes.

CLAUDE

Claude 4.7 explica com precisão as origens da injeção de prompt

Um relatório de pesquisa do Claude 4.7 traçou com precisão o histórico dos ataques de injeção de prompt, referenciando tweets e exemplos adversariais que primeiro demonstraram a vulnerabilidade.

PRODUTO

Luma Agents gera quadros de propostas vencedores para clientes

O Luma Agents planeja, gera e otimiza automaticamente quadros de propostas para clientes. Basta definir o briefing e a direção estética, e o agente produz propostas de alta qualidade.