Perplexity Terbitkan Studi Kinerja Inferensi Qwen3 235B di GPU Blackwell
Riset menunjukkan bahwa melayani model Qwen3 235B pasca-pelatihan di platform NVIDIA GB200 NVL72 Blackwell meningkatkan throughput secara signifikan dibanding Hopper.
GB200 bukan sekadar platform pelatihan — ia mengubah cara prefill dan decode disaggregation untuk model MoE besar seperti Qwen. Arav Srinivas menegaskan bahwa tumpukan mereka kini dioptimalkan untuk throughput yang jauh melampaui generasi Hopper sebelumnya.
Google Luncurkan Gemini Intelligence Bawa Otomatisasi Multi-Langkah ke Android
CEO Google Sundar Pichai mengumumkan Gemini Intelligence di Android Show, memungkinkan otomatisasi tugas multi-langkah lintas aplikasi dan Chrome.
Fitur Rambler mengubah pikiran lisan menjadi teks yang terstruktur, sementara otomatisasi lintas aplikasi memungkinkan pengguna menyelesaikan alur kerja kompleks tanpa berpindah aplikasi secara manual. Ini adalah lompatan besar dari sekadar asisten suara menjadi agen produktivitas penuh.
Pembelajaran simbolik bukan pengganti agen pemrograman, melainkan pengganti gradient descent dan jaringan saraf: sebuah substrat pembelajaran baru yang sepenuhnya umum dan sangat skalabel.
François Chollet, Pencipta Keras
Mode Cepat Claude Opus 4.7 Dibuka sebagai Pratinjau Riset
Anthropic memperkenalkan mode cepat untuk Claude Opus 4.7, tersedia melalui API dan Claude Code, memberikan kecepatan 2,5× lipat dengan biaya 6× lipat. Untuk sebagian besar tugas, kecepatan standar tetap direkomendasikan.
Google DeepMind Rancang Ulang Interaksi Pointer Mouse dengan AI
Pointer AI eksperimental memadukan gerakan, suara, dan steno alami, memungkinkan pengguna mengarahkan Gemini di layar secara intuitif — sebuah reimajinasi antarmuka berusia 50 tahun.
Hugging Face Hub Lampaui 1 Juta Dataset Publik
Model terbuka memerlukan data terbuka. Hugging Face merayakan tonggak 1 juta dataset publik di Hub, menegaskan komitmen terhadap ekosistem open-source AI.
ModernColBERT Hampir Selesaikan BrowseComp-Plus Hanya dengan 149M Parameter
Reason-ModernColBERT menghancurkan SOTA pada benchmark BrowseComp-Plus hanya dengan 149M parameter, mengungguli model 54 kali lebih besar — sebuah pencapaian efisiensi yang mencengangkan.
Meta Diam-diam Rilis Rangkaian Model Manusia Resolusi Tinggi Sapiens2
Meta meluncurkan Sapiens2, keluarga model resolusi tinggi yang dilatih pada 1 miliar gambar manusia, untuk tugas seperti estimasi pose — dirilis tanpa pengumuman besar.
Makalah Baru: Model Difusi Embedding Terkondisi Mandiri Saingi Generasi Teks Autoregresif
Self-conditioned Embedding Diffusion memperkenalkan model difusi teks dalam ruang embedding kontinu yang menyamai kualitas generasi autoregresif dengan inferensi lebih efisien. Disebut sebagai penerus spiritual dari SED.
Tongyi Rilis Laporan Teknis Qwen-Image-2.0
Laporan teknis model gambar Qwen-Image-2.0 dari Alibaba Tongyi Qianwen telah dibagikan oleh komunitas riset, diharapkan mencakup detail arsitektur dan data kinerja yang akan menjadi acuan penting dalam riset model generasi gambar berbasis difusi.
Codex Kini Dapat Mengontrol Komputer Lintas Aplikasi di Latar Belakang
Fitur Computer use Codex dapat mengeklik, mengetik, dan bekerja terus-menerus di seluruh aplikasi tanpa mengambil alih Mac, sambil berjalan di latar belakang.
Symphony: Agen Codex Khusus untuk Setiap Tugas
Symphony menugaskan agen Codex yang berjalan untuk setiap tugas yang harus dilakukan, memungkinkan otomatisasi menyeluruh tanpa perlu manajemen manual.
Mantan CTO OpenAI Luncurkan Model Interaktif Multimodal Real-Time
Thinking Machines milik Mira Murati meluncurkan model yang menyerap input multimodal asli (audio, video, teks) dan berpikir, merespons, serta bertindak secara real-time, melampaui penyambungan agen tradisional.
Editor Cursor Integrasikan Mode Cepat Claude Opus 4.7
Menawarkan kecepatan 2,5× lipat, dengan rekomendasi kecepatan standar untuk sebagian besar tugas pemrograman sehari-hari.
Elon Musk Umumkan Grok Kini Punya Fitur Keterampilan
Grok kini memiliki fitur keterampilan, kemungkinan merujuk pada modul plug-in atau kemampuan baru yang memperluas fungsionalitas asisten AI ini.
Andrew Ng Tepis Kiamat Pekerjaan AI, Sebut Kepanikan Tidak Bertanggung Jawab
Andrew Ng mencuit bahwa AI tidak akan menyebabkan pengangguran massal, menyebut cerita panik semacam itu tidak bertanggung jawab dan berbahaya, serta berargumen bahwa gelombang teknologi pada akhirnya menciptakan lebih banyak lapangan kerja.
Kerangka Agen physics-intern Tingkatkan Kinerja Model Fisika Teoretis
Meningkatkan akurasi Gemini 3.1 Pro dari 17,7% menjadi 31,4% pada benchmark CritP — sebuah lonjakan signifikan di domain penalaran fisika.
TMAS Skalakan Komputasi Waktu Uji lewat Sinergi Multi-Agen
Riset baru TMAS memanfaatkan kolaborasi multi-agen untuk menskalakan komputasi waktu uji dan meningkatkan kemampuan penalaran.
Soohak Kurasi Matematikawan Evaluasi Kemampuan Matematika Riset LLM
Benchmark baru yang dikurasi oleh para matematikawan, menilai kompetensi model bahasa besar dalam matematika tingkat riset.
Pengguna M3 Max Dapatkan Pengalaman AI Lokal Lewat DeepSeek V4 GGUF
antirez merilis file GGUF untuk DeepSeek V4, memungkinkan eksekusi lokal — memicu candaan bahwa pemilik M3 Max mendapatkan AGI lokal sebelum GTA 6.
Platform v0 Kini Hadirkan Mode Cepat Claude Opus 4.7
Platform v0 milik Vercel mengumumkan pengguna kini dapat menggunakan mode cepat Claude Opus 4.7 untuk pengembangan UI berbasis AI.
Arsitektur Percakapan Suara Real-Time KAME
KAME mengalirkan model suara cepat dengan model besar backend untuk menyuntikkan pengetahuan ke dalam percakapan suara real-time, pendekatan tandem yang elegan.
Pidato Wisuda CMU Jensen Huang: Pimpin Masa Depan AI dengan Kebijaksanaan
CEO NVIDIA mengatakan kepada lulusan Carnegie Mellon 2026 untuk tidak takut pada AI tetapi membimbingnya dengan bijak, menyerukan optimisme, tanggung jawab, dan ambisi.
NVIDIA Earth-2 Bantu Universitas Colorado Perpanjang Waktu Peringatan Hujan Es
Colorado State University menggunakan NVIDIA Earth-2 dan PhysicsNeMo untuk meningkatkan waktu peringatan prediksi hujan es dari hitungan menit menjadi jam.
Server Parsing Dokumen Self-Hosted liteparse
Layanan parsing dokumen sumber terbuka yang sepenuhnya self-hosted, mendukung parsing lokal dan tangkapan layar untuk PDF, file Office, dan gambar.
Claude for Legal Diluncurkan dengan 12 Plugin Hukum
Perpustakaan khusus hukum menawarkan 12 plugin berbasis peran dan 20+ konektor MCP yang mencakup operasi hukum, M&A, privasi, dan lainnya.
Bocoran: Google Mungkin Rilis Generasi Video Veo 4
Dengan fitur pengeditan video referensi dan kualitas generasi teks yang sedikit lebih unggul dari Seedance 2.0, Veo 4 menjadi pesaing serius di ranah video generatif.
Tampilan Agen untuk Kelola Beberapa Agen Latar Belakang
Fitur baru memungkinkan pengguna mengelola beberapa agen yang berjalan di tab terminal, memeriksa status, dan meluncurkannya di latar belakang.
Luma Agents Luncurkan Alat Optimasi Iklan dan Generasi Kreatif
Membantu tim menetapkan arah optimasi dan menghasilkan versi iklan berkinerja lebih tinggi di seluruh materi kreatif dan teks.
Mode Turbo 5× Lebih Cepat untuk Generasi Video
Vidu meluncurkan mode Turbo, menghasilkan video 5 kali lebih cepat dari rata-rata industri, membantu kreator beriterasi lebih cepat.
Pixal3D: Metode Generasi 3D Selaras Piksel
Metode selaras piksel untuk menghasilkan aset 3D dengan fidelitas tinggi dari gambar, ditujukan untuk SIGGRAPH 2026.
Rebellious Student: Self-Distillation RLVR dengan Sinyal Guru Terbalik
Metode reinforcement learning self-distillation yang mengeksplorasi penalaran dengan membalik sinyal guru — pendekatan inovatif dalam pelatihan penalaran LLM.
Slime: Kerangka Pelatihan RL Paling Elegan untuk Model Besar
Artikel mendalam mengeksplorasi bagaimana kerangka Slime mendefinisikan ulang pelatihan reinforcement learning untuk model besar dengan pendekatan yang lebih nyaman dan elegan.
Skala Infrastruktur Hugging Face Kagumkan CEO, Dorong Migrasi
Clement Delangue merekomendasikan pengguna yang masih di S3 atau R2 untuk bermigrasi ke HF demi kinerja dan keamanan lebih baik.
Ethan Mollick Kritik ChatGPT yang Diam-diam Hapus Mode Belajar
Menghapus Mode Belajar ChatGPT adalah kesalahan, mengutip bukti bahwa mode asisten dapat merusak pembelajaran karena memberikan jawaban langsung — membuat siswa merasa telah belajar padahal belum. Claude dan Gemini masih mempertahankan fitur serupa.
Mollick: Lab AI yang Percaya ASI Akan Bubarkan Tim Rekayasa Deployment
Selama integrasi manusia dan manajemen perubahan masih diperlukan, pekerjaan aman. Keyakinan sejati pada ASI berarti menghilangkan tim deployment depan — dan sejauh ini, belum ada lab AI yang melakukannya.
GGUF Terkuantisasi untuk Qwen3.6-35B-A3B
Versi GGUF terkuantisasi dengan MTP diaktifkan, memudahkan inferensi lokal.
Pratinjau OpenMed Agent Berbasis Hugging Face
Memanfaatkan endpoint HF untuk ekstraksi klinis dan pemrosesan terminologi medis.
Infrastruktur Hugging Face Mencengangkan
Clement Delangue: skala infrastruktur HF luar biasa untuk hosting model dan dataset.
Inisiatif Open Defense $5 Juta untuk Keamanan Open Source
Jeff Dean membagikan inisiatif yang menawarkan kredit lab hingga $5 juta untuk melindungi proyek open source.
Dua Model Bahasa Kecil Open Source Segera Hadir
Satu mencapai akurasi mutakhir dengan ukuran 93 kali lebih kecil.
Panduan Ultimate RL Environment Puncaki Trending HF Spaces
Panduan membangun dan menskalakan lingkungan reinforcement learning.
M2.7 Permudah Migrasi via LilacML
Model M2.7 kini lebih mudah diterapkan dan digunakan dengan bantuan LilacML.
Gerakan Robot Dikendalikan Gestur
Alat browser untuk membuat gerakan robot Reachy Mini melalui gestur ponsel atau komputer.