10 de maio de 2026 · domingo

MiniCPM-o 4.5 Lançado: Interação Multimodal Full-Duplex em Tempo Real

O framework Omni-Flow alinha entradas e saídas multimodais em um eixo temporal contínuo, permitindo que o modelo veja, ouça e fale simultaneamente com 9 bilhões de parâmetros.

O MiniCPM-o 4.5 emite alertas proativos com base na compreensão contínua de cenas em tempo real.

O MiniCPM-o 4.5, desenvolvido pela OpenBMB, introduz o Omni-Flow, uma arquitetura de streaming unificada que alinha entradas e saídas multimodais em um eixo temporal contínuo. O modelo vê, ouve e fala simultaneamente, gerando alertas e comentários proativos com base na compreensão persistente de cenas em tempo real — um salto rumo a assistentes de IA verdadeiramente multimodais e sempre atentos. Com 9 bilhões de parâmetros distribuídos entre visão, linguagem e áudio, o modelo alcança desempenho visual-linguístico próximo ao Gemini 2.5 Flash, estabelecendo o estado da arte open-source para sua escala. Em compreensão multimodal completa, supera o Qwen3-Omni-30B-A3B com geração de voz superior e maior eficiência computacional. Otimizações de atenção esparsa e quantização adaptativa permitem inferência com menos de 1 GB de memória, viabilizando implantações em dispositivos de borda.

Visualização do projeto que reproduziu 58 artigos de Jürgen Schmidhuber usando assistência de codificação com IA.

Assistente de Codificação com IA Reproduz Todos os Artigos de Schmidhuber

Um projeto ambicioso utilizou assistentes de codificação com IA para reproduzir 58 artigos de Jürgen Schmidhuber cobrindo 36 anos de pesquisa, todos implementados em NumPy puro e executáveis em um laptop comum.

O projeto, liderado por Yaroslav Bulatov e compartilhado por hardmaru, conseguiu reproduzir sistematicamente todos os problemas de aprendizado sintético dos artigos de Schmidhuber publicados entre 1989 e 2025. Cada implementação é autossuficiente em NumPy puro, sem dependências pesadas de frameworks de deep learning, e inclui métricas de comparação com os resultados originais. O projeto também recriou com sucesso o influente artigo "World Models", coautorado por hardmaru e Schmidhuber, com uma implementação completa de VAE e RNN para um ambiente de brinquedo. O feito demonstra que assistentes de codificação com IA estão se tornando ferramentas viáveis para replicação científica sistemática, reduzindo drasticamente o tempo necessário para validar e estender pesquisas anteriores.

Codificação inteligente é uma forma de aprendizado de máquina. O código gerado deve ser tratado como um artefato caixa-preta cujo comportamento e generalização são gerenciados por avaliação empírica.

François Chollet, autor do Keras
INDÚSTRIA E PESQUISA10·05·2026
OPENAI

Sam Altman Chama o GPT-5.5 de "Gênio Autista" com Gosto Estranho para Nomes

O CEO da OpenAI descreveu o GPT-5.5 como um "gênio autista com um gosto muito estranho para nomear coisas", em um tuíte que gerou intensa discussão na comunidade de IA sobre a personalidade emergente dos modelos.

INDÚSTRIA

Chollet: IA Amplifica a Lacuna de Agência Entre Usuários

François Chollet observou que a IA está amplificando um efeito de agência auto-composto: usuários com baixa agência perdem ainda mais autonomia, enquanto os de alta agência se tornam ainda mais capazes.

PESQUISA · RL

Destilação Multi-Professor Pode Superar Treinamento RL Multi-Domínio

Pesquisadores apontam que a destilação on-policy com múltiplos professores oferece vantagens sobre o treinamento por reforço em múltiplos domínios, que sofre de dificuldades estatísticas e de modelagem.

OPINIÃO

"Não Existe Pré-Treinamento nem Pós-Treinamento, Apenas Treinamento"

O pesquisador Arohan argumenta que as divisões entre pré-treinamento, pós-treinamento e treinamento em tempo de teste são artefatos organizacionais: existem apenas priors, atualizações, restrições e orçamentos de computação.

FORMAÇÃO

swyx Recomenda Tutorial Essencial para Todos os Engenheiros de IA

swyx comparou um novo tutorial à importância histórica do "Kubernetes The Hard Way" de Kelsey Hightower, recomendando que engenheiros de IA o estudem por precaução, não apenas sob demanda.

ROBÓTICA

Ethan Mollick Defende Benchmarks Independentes para Robótica com IA

O professor da Wharton apontou que, ao contrário do progresso em IA rastreável por benchmarks, a robótica carece de padrões independentes como o ARC-AGI, dificultando a avaliação objetiva dos avanços na área.

PRODUTO · LUMA

Luma Lança Agentes Criativos para Campanhas Visuais de Recrutamento

A Luma lançou os Luma Agents, ferramenta criativa que ajuda equipes a planejar, gerar e iterar conteúdo visual para campanhas de recrutamento, mantendo coerência de contexto em todo o fluxo de criação.