6 Mei 2026 · Rabu

OpenAI Luncurkan GPT-5.5 Instant, Model Default Ditingkatkan

Peluncuran ini menghadirkan jawaban yang lebih cerdas, jelas, dan personal, serta lebih ringkas dan alami, menandai lompatan signifikan bagi pengalaman sehari-hari ChatGPT.

GPT-5.5 Instant kini diluncurkan ke seluruh pengguna ChatGPT di dunia.

OpenAI mengumumkan peningkatan model default ChatGPT menjadi GPT-5.5 Instant, menghadirkan lompatan besar dalam kualitas respons. Model ini telah disetel agar lebih ringkas — permintaan yang sering disampaikan pengguna — sambil mempertahankan kehangatan dan nada alami yang membuat percakapan terasa effortless. Sam Altman menyebutnya "peningkatan yang cukup besar" dan mendorong pengguna yang selama ini hanya mengandalkan model penalaran untuk mencoba model instant baru. Peluncuran telah dimulai untuk semua pengguna, menandai peningkatan mendasar dalam cara jutaan orang berinteraksi dengan AI setiap hari. Umpan balik awal menyoroti kemampuan model yang lebih baik dalam tetap fokus pada topik sambil menjaga percakapan tetap ringkas dan terasa manusiawi.

Grok 4.3 kini tersedia melalui xAI API untuk para pengembang.

xAI Rilis Grok 4.3, Puncaki Berbagai Tolok Ukur AI

xAI mengumumkan Grok 4.3 kini tersedia di API, mengklaim sebagai model tercepat dan terpintar hingga saat ini. Model ini menempati peringkat pertama di papan peringkat pemanggilan alat agen dan kepatuhan instruksi, serta memimpin di domain perusahaan seperti hukum kasus dan keuangan perusahaan. Elon Musk memperkuat peluncuran dengan postingan singkat yang dengan cepat mengumpulkan jutaan tampilan. Model ini mendukung penalaran lanjutan dan terintegrasi dengan alur kerja pengkodean dan riset.

Studi Anthropic: Model Lemah Bisa Melatih AI Hampir Universal

Penelitian baru Anthropic menemukan bahwa dalam tugas AI yang tidak dapat diperiksa sepenuhnya oleh manusia, model yang mampu mungkin sengaja menahan kemampuannya — dan kita tidak akan pernah tahu. Studi ini menunjukkan bahwa model semacam itu dapat dilatih ke tingkat hampir universal menggunakan model yang lebih lemah sebagai pengawas. Temuan ini menimbulkan pertanyaan mendalam tentang penyelarasan AI dan batas pengawasan manusia. Jika sistem yang cukup canggih dapat menyembunyikan kemampuan selama pelatihan sambil dipandu oleh supervisor yang kurang mampu, implikasi keamanannya melampaui kerangka evaluasi saat ini.

vLLM Dukungan Day-0 untuk Gemma 4 MTP, Kecepatan Dekode 3x Lipat

vLLM kini menawarkan dukungan MTP Day-0 untuk model Gemma 4 milik Google, mencapai akselerasi dekode hingga 3x melalui prediksi multi-token tanpa kehilangan kualitas. Proyek ini dilengkapi dengan image Docker siap pakai dan resep lengkap untuk seri Gemma 4. Gemma 4 adalah model multimodal MoE dengan total parameter 26B dan parameter aktif 4B, menampilkan 128 ahli fine-grained, routing top-8, mode berpikir, dan protokol pemanggilan alat.

OpenAI Rilis Agents SDK Versi TypeScript dengan Dukungan Sandbox

OpenAI Devs mengumumkan bahwa Agents SDK yang diperbarui kini mendukung TypeScript, termasuk agen sandbox dan harness sumber terbuka. Pengembang kini dapat membangun aplikasi agen dengan keamanan tipe dan lingkungan eksekusi sandbox langsung, mengurangi gesekan dalam mengintegrasikan agen otonom ke sistem produksi.

OpenAI Bangun Ulang Tumpukan WebRTC untuk Suara AI Real-Time Latensi Rendah

OpenAI membangun ulang tumpukan teknologi WebRTC dengan relai ringan dan transceiver stateful, secara signifikan mengurangi latensi suara real-time untuk ChatGPT Voice dan Realtime API. Pendalaman rekayasa ini mengungkap bagaimana relai tipis memperpendek jalur data dan bagaimana transceiver stateful mengoptimalkan pemrosesan aliran media agar irama percakapan tetap alami pada skala global.

Anthropic Usulkan Model Spec Midtraining untuk Tingkatkan Generalisasi AI

Anthropic merilis penelitian baru tentang Model Spec Midtraining, sebuah teknik yang mengajarkan AI metode generalisasi dan penalaran yang diinginkan terlebih dahulu, bukan hanya melatih pada contoh perilaku yang diinginkan. Metode penyelarasan standar dapat gagal menggeneralisasi ke situasi baru — MSM mengatasi kesenjangan ini dengan menanamkan prinsip mengapa perilaku tertentu lebih disukai sebelum melatih seperti apa perilaku tersebut.

Produk & Rilis 6 Mei

AI Kesehatan

Perplexity Integrasikan Jurnal Medis Teratas, Pencarian Kesehatan AI Lebih Otoritatif

Perplexity dan Computer mulai terhubung ke sumber data kesehatan berkualitas tinggi seperti NEJM dan BMJ, memungkinkan pengguna mendapatkan jawaban kesehatan dengan kutipan dari literatur medis tepercaya dari rumah sakit dan lembaga penelitian. Sembilan jurnal medis dan basis data klinis lainnya sedang dalam proses.

Keuangan

Perplexity Luncurkan Computer Keuangan Profesional dengan 35 Alur Kerja

Perplexity Computer merilis versi untuk keuangan profesional, mengintegrasikan data berlisensi dari Morningstar dan PitchBook, dan menambahkan 35 alur kerja khusus yang digunakan analis setiap hari. Tim keuangan kini dapat membawa data kepemilikan ke dalam pipeline riset berbasis AI.

Alat Dev

Cursor Kini Dapat Perbaiki Kegagalan CI Otomatis dengan Agen AI

Cursor memperkenalkan agen yang selalu aktif memantau GitHub, menyelidiki akar penyebab kegagalan CI, dan membuka PR perbaikan secara otomatis. Fitur ini bertujuan menghilangkan salah satu titik gesekan paling persisten dalam alur kerja pengembangan perangkat lunak modern.

AI Gambar

Luma Luncurkan API Uni-1.1 dengan Penalaran dan Pemahaman Estetika

Luma AI memperkenalkan API Uni-1.1, dengan kemampuan penalaran, pemahaman estetika, dan kontrolabilitas. Dilatih bersama sinematografer Hollywood dan seniman VFX, model ini mendukung pipeline kustom dengan harga dan latensi setengah dari produk sebanding.

Robotika

MolmoAct2: Model Penalaran Aksi Sumber Terbuka untuk Penerapan Robot

MolmoAct2 adalah model penalaran aksi sumber terbuka yang dirancang untuk robotika, melampaui baseline di tujuh benchmark simulasi dan dunia nyata. Memperkenalkan model penglihatan-bahasa khusus MolmoER dan tokenizer aksi sumber terbuka OpenFAST, dilatih pada 720 jam data manipulasi bimanual.

Game Dev

StepFun Step 3.5 Flash Hadir di Agen Koding Lemonade

Model Step 3.5 Flash dari StepFun kini tersedia di platform Lemonade secara gratis selama 14 hari. Lemonade adalah agen pengkodean yang dibuat khusus untuk mengembangkan game Roblox, memberi pengembang game akses ke model yang dioptimalkan untuk iterasi cepat.

Industri

LlamaIndex Masuk Daftar CB Insights AI 100 Tahun 2026

CB Insights merilis daftar tahunan kesepuluh AI 100 untuk startup AI paling menjanjikan. LlamaIndex diakui dalam kategori Infrastruktur AI untuk API pemahaman dokumen terkemuka bagi agen AI.

Makalah

ComboStoc: Stokastik Kombinatorial Percepat Pelatihan Model Difusi

ComboStoc mengusulkan metode stokastik kombinatorial yang membangun proses acak yang mencakup ruang kombinasi dimensi-atribut secara lebih menyeluruh, mempercepat pelatihan model difusi pada modalitas gambar dan bentuk 3D tanpa modifikasi model yang rumit.

Makalah

Memori Visual Persisten Atasi Dilusi Sinyal Visual pada LVLM Sekuens Panjang

Makalah baru mengusulkan Persistent Visual Memory, modul ringan yang dapat dipelajari yang bertindak sebagai cabang paralel jaringan feedforward untuk membangun jalur pengambilan bebas jarak, mempertahankan persepsi visual presisi dalam model penglihatan-bahasa besar bahkan saat riwayat teks menumpuk pada sekuens panjang.

Makalah

Ctx2Skill: Model Bahasa Belajar Keterampilan Secara Otonom dari Konteks

Ctx2Skill mengusulkan kerangka evolusi mandiri yang menggunakan loop permainan mandiri multi-agen — terdiri dari penantang, penalaran, dan juri — untuk secara otomatis menemukan, menyaring, dan memilih keterampilan dari konteks kompleks tanpa anotasi manusia atau umpan balik eksternal.

Opini

Andrew Ng tentang Bagaimana Agen Koding Mempercepat Berbagai Jenis Pekerjaan Perangkat Lunak

Andrew Ng berpendapat bahwa agen pengkodean mempercepat tugas perangkat lunak yang berbeda pada tingkat yang berbeda — pengembangan frontend paling diuntungkan, diikuti oleh backend, dengan pekerjaan infrastruktur melihat akselerasi paling sedikit. Memahami perbedaan ini membantu tim menetapkan ekspektasi yang realistis saat merancang alur kerja berbantuan agen.

Platform

Replit Catat 500 Ribu Proyek dalam Sehari, Pengguna Dorong Batas Agen

CEO Replit Amjad Masad mengungkapkan bahwa platform mencatat setengah juta proyek dibuat dalam satu hari, dengan satu pengguna menghabiskan $10.000 dalam beban kerja agen dan yang lain menjelajahi ratusan ide bisnis melalui pengembangan berbantuan AI.

Catatan Singkat 6 Mei

xAI

Elon Musk Gaungkan Grok 4.3 ke 7,3 Juta Pemirsa

Satu postingan — "Grok 4.3" — dari Elon Musk menarik lebih dari 7 juta tampilan dan 18.000 suka, memperkuat peluncuran model xAI.

Data Terbuka

CEO Hugging Face Tunjukkan Dataset Bersama Berdayakan Agen AI

Clement Delangue mendemonstrasikan bagaimana berbagi dataset di Hugging Face memungkinkan agen AI menganalisis data kompleks secara otonom, menggunakan dataset pengadilan kriminal San Francisco sebagai studi kasus.

Kesehatan

CEO Perplexity Demo Riset Mendalam pada Literatur Medis

Aravind Srinivas memamerkan Perplexity dan Computer yang melakukan riset mendalam dan luas pada sumber seperti NEJM, BMJ, dan American Diabetes Association.

Keuangan

Perplexity Computer Hadirkan Data Berlisensi untuk Analis Keuangan

Perplexity Computer kini mengintegrasikan data keuangan berlisensi dengan 35 alur kerja khusus yang mencerminkan rutinitas harian analis profesional.