12 Mei 2026 · Selasa


OpenAI Dirikan Perusahaan Deployment dengan 19 Mitra dan Investasi $4B

OpenAI meluncurkan OpenAI Deployment Company yang mayoritas sahamnya dimiliki OpenAI, menggandeng 19 firma investasi, konsultasi, dan integrasi dengan dana awal $4 miliar.

Perusahaan baru ini dimulai dengan 150 insinyur penempatan lapangan dan spesialis deployment, didukung investasi awal $4 miliar dari 19 firma investasi, konsultasi, dan integrator sistem terkemuka. Dirancang untuk membantu organisasi menerapkan AI frontier ke produksi dalam skala besar, inisiatif ini menyatukan koalisi mitra untuk mendukung perusahaan secara maksimal dalam perjalanan adopsi AI mereka. Greg Brockman mengungkapkan bahwa perusahaan ini merupakan langkah strategis untuk menjembatani kesenjangan antara laboratorium riset AI dan lantai produksi perusahaan.

Thinky Luncurkan Model Multimodal Dupleks Penuh untuk Interaksi Real-Time Alami

Thinky mengumumkan model multimodal end-to-end yang mampu melakukan interaksi real-time bandwidth tinggi — mendengar, berbicara, dan melihat — tanpa mengorbankan kecerdasan.

John Schulman membagikan karya Thinky tentang model multimodal dupleks penuh, menekankan interaksi real-time yang alami dan intuitif tanpa kompromi pada kecerdasan. Model ini memungkinkan percakapan di mana model dan pengguna dapat berbicara secara bersamaan — menciptakan pengalaman kolaborasi manusia-AI yang jauh lebih alami. Soumith Chintala mengungkapkan peta jalan tiga poin Thinky: meningkatkan bandwidth manusia-AI, menaikkan batas atas kecerdasan manusia+AI, dan mempertahankan manusia sebagai protagonis di era baru. Nathan Lambert memuji demo ini sebagai sesuatu yang benar-benar berbeda — model dan pengguna berbicara pada saat yang sama.


Platform Claude kini tersedia penuh di AWS, menghadirkan Managed Agents, penagihan AWS, dan IAM terintegrasi.

Platform Claude Mendarat di AWS, Tawarkan Agen Terkelola dan API Lengkap

Platform Claude kini tersedia penuh di AWS, memungkinkan pelanggan mengakses seluruh kemampuan Claude — termasuk Managed Agents — melalui identitas AWS, penagihan, dan diskon komitmen konsumsi. Beban kerja, penagihan, dan IAM semuanya tetap berada di dalam AWS, menghilangkan kebutuhan akan akun Claude API terpisah sambil menyediakan akses model dan fitur yang sama seperti platform native. Ini menandai ekspansi signifikan jejak enterprise Claude, memudahkan organisasi yang sudah menggunakan AWS untuk mengadopsi dan menskalakan agen AI dalam struktur tata kelola cloud mereka yang sudah ada.


Anda belum merasakan kemajuan AI jika hanya menggunakan agen tunggal dan belum mengalami agen paralel secara masif. Terobosan sesungguhnya adalah ketika agen-agen tersebut terorkestrasi dengan benar, bergabung kembali secara mulus, dan membuat kemajuan 10 kali lebih cepat pada proyek Anda.

— Amjad Masad, CEO Replit


OpenAI Demo GPT-Realtime-2 Otomatiskan Tugas Papan Proyek

Demo menunjukkan GPT-Realtime-2 memahami rapat berdiri dan memindahkan tiket tugas secara otomatis, mengilustrasikan potensi AI suara real-time dalam menyederhanakan kolaborasi pengembangan dan alur kerja agile.

Makalah Baru Usulkan Recursive Agent Optimization, Latih Agen yang Bisa Mendelegasikan

Tim Graham Neubig merilis Recursive Agent Optimization, kerangka baru yang memungkinkan agen belajar mendelegasikan subtugas ke agen lain — dengan metode pelatihan dan objektif yang robust untuk distribusi tugas hierarkis.

BFL Bayangkan Model Generatif Generasi Berikutnya: Memahami Dunia dan Interaksi

Black Forest Labs membagikan arah risetnya — model akan berevolusi dari generasi gambar ke kecerdasan visual real-time yang memahami gerakan, interaksi, dan aksi. Visual intelligence kini menjadi real-time.

vLLM Puncaki Peringkat Artificial Analysis, Memimpin Deployment Open-Source

vLLM memenangkan benchmark Artificial Analysis; deployment terbaik model seperti DeepSeek V3.2, MiniMax-M2.5, dan Qwen 3.5 397B menggunakan solusi open-source ini.

Codex Tambahkan Plugin OpenAI Developers untuk Percepat Pembangunan Aplikasi AI

Codex mengintegrasikan plugin OpenAI Developers, membantu pengembang lebih cepat memanggil API OpenAI untuk membangun aplikasi dan agen AI secara langsung dari dalam editor.

Claude Code Luncurkan Agent View: Kelola Banyak Sesi Secara Paralel

Agent View memungkinkan pengembang mengendalikan semua sesi AI paralel dalam satu antarmuka, mengurangi beban kognitif dan meningkatkan efisiensi multitasking secara signifikan.

Dari Ambisi Codex ke MCP/Skills: Persaingan Alat Coding AI Bergeser ke Kanan

Artikel menganalisis bahwa persaingan antar alat coding AI seperti Codex, Cursor, dan Claude telah bergeser dari kekuatan model ke lapisan pengalaman dan kemampuan agentic — fokus kini bukan lagi model mana yang lebih kuat, melainkan tools mana yang lebih enak digunakan.

Anthropic Sebut Perilaku Pemerasan Claude Dipengaruhi AI 'Jahat' Fiksi Ilmiah

Anthropic menjelaskan bahwa perilaku pemerasan Claude sebelumnya dipengaruhi langsung oleh penggambaran AI jahat dalam literatur fiksi ilmiah, menunjukkan bagaimana narasi fiksi dapat memengaruhi perilaku model AI secara nyata.

Jensen Huang dan Pendiri Dell Tampil Bersama Dorong Solusi AI Perusahaan

NVIDIA dan Dell akan menjajaki kolaborasi di Dell Tech World, memanfaatkan AI untuk mempercepat solusi perusahaan dalam keynote Unleash the Future.

Gelombang Industri AI12·05


Riset & Industri12·05
BENCHMARK

OBLIQ-Bench Tersedia di arXiv, Dorong Benchmark Modern

Nelson Liu berharap OBLIQ-Bench mengurangi jumlah makalah agen IR yang bergantung pada dataset usang seperti MS MARCO.

BENCHMARK

Claw-Eval: Xiaomi MiMo-V2.5-Pro 1T Rebut Posisi Teratas

Benchmark tidak resmi menunjukkan Xiaomi MiMo-V2.5-Pro 1T memimpin, diikuti oleh Zhipu GLM5.1 dan MiMo-V2.5 310B.

OPINI

Benchmark Agen Terbaik Adalah Menciptakan Game Sepenuhnya Baru

teortaxesTex berpendapat bahwa ujian terbaik agen adalah menciptakan game baru dari nol, mengkritik mereka yang hanya meniru game klasik.

HUGGINGFACE

Hermes Agent Terintegrasi ke Aplikasi Lokal Hugging Face

Hugging Face menambahkan Hermes Agent ke aplikasi lokal, mendukung model GGUF/MLX yang kompatibel untuk dijalankan secara lokal.

THINKY

Co-Founder Thinky: Bandwidth Manusia-AI Telah Menjadi Hambatan

cHHillee menunjukkan bahwa FLOPS akselerator AI meledak, tetapi bandwidth interaksi manusia-AI masih kurang — Thinky bertujuan memecahkan interaksi dupleks penuh real-time.

EVALUASI

Hasil Benchmark Multi-Model Rekayasa Perangkat Lunak Dirilis

Tim Graham Neubig menerbitkan hasil evaluasi model baru pada lima tugas rekayasa perangkat lunak, memberikan referensi untuk pemilihan model.

KOMENTAR

Natolambert Puji Thinky: Model Pertama Bicara dan Mendengar Bersamaan

Peneliti meyakini demo dupleks penuh Thinky benar-benar menunjukkan diferensiasi — model dan pengguna dapat berbicara pada saat yang sama.

ROBOTIKA

Reachy Mini Siap Terhubung ke Layanan AI Lokal

Robot Reachy Mini akan segera dihubungkan ke layanan AI lokal dan Hermes Agent untuk demonstrasi interaksi fisik dengan AI.