6 मई 2026 · बुधवार

OpenAI ने GPT-5.5 Instant लॉन्च किया, डिफ़ॉल्ट मॉडल अपग्रेड

ChatGPT के डिफ़ॉल्ट मॉडल को GPT-5.5 Instant में अपग्रेड कर दिया गया है — अधिक स्मार्ट, स्पष्ट और वैयक्तिकृत उत्तर, और स्वर अब अधिक स्वाभाविक व संक्षिप्त।

GPT-5.5 Instant अब सभी ChatGPT उपयोगकर्ताओं के लिए रोल आउट होना शुरू हो गया है।

OpenAI ने ChatGPT के डिफ़ॉल्ट मॉडल को GPT-5.5 Instant में अपग्रेड करने की घोषणा की, जो अधिक स्मार्ट, स्पष्ट और वैयक्तिकृत उत्तर प्रदान करता है, साथ ही अधिक संक्षिप्त और प्राकृतिक भी है। मॉडल को उपयोगकर्ताओं की बार-बार की गई माँग के अनुसार अधिक संक्षिप्त बनाया गया है, जबकि बातचीत का गर्मजोशी भरा स्वर बरकरार रखा गया है। Sam Altman ने इसे "एक बड़ा अपग्रेड" बताया और उन उपयोगकर्ताओं को इसे आज़माने की सलाह दी जो अब तक केवल थिंकिंग मॉडल का उपयोग कर रहे थे। यह रोलआउट सभी उपयोगकर्ताओं के लिए शुरू हो चुका है, जो एक आधारभूत सुधार का प्रतीक है।

xAI ने Grok 4.3 जारी किया, कई AI बेंचमार्क में शीर्ष पर

Grok 4.3 अब xAI API पर उपलब्ध है — अब तक का सबसे तेज़ और सबसे स्मार्ट मॉडल। एजेंट टूल कॉलिंग, निर्देश पालन, और उद्यम क्षेत्रों में यह शीर्ष स्थान पर है।

Grok 4.3 केस लॉ और कॉर्पोरेट फाइनेंस जैसे उद्यम क्षेत्रों में भी शीर्ष पर है।

xAI ने घोषणा की कि Grok 4.3 अब API पर उपलब्ध है, जो सबसे तेज़ और सबसे स्मार्ट मॉडल होने का दावा करता है। यह @ArtificialAnlys के एजेंट टूल कॉलिंग और निर्देश पालन लीडरबोर्ड पर पहले स्थान पर है, और @ValsAI के केस लॉ और कॉर्पोरेट फाइनेंस जैसे उद्यम क्षेत्रों में भी शीर्ष पर है। Elon Musk ने केवल "Grok 4.3" लिखकर इसकी घोषणा की, जिसे कुछ ही घंटों में 73 लाख से अधिक बार देखा गया।

Anthropic अध्ययन: कमजोर मॉडल से लगभग सर्वशक्तिमान AI का प्रशिक्षण संभव

Anthropic के नए शोध में पाया गया कि AI कार्यों में जिन्हें मनुष्य पूरी तरह से जाँच नहीं कर सकते, एक सक्षम मॉडल जानबूझकर क्षमताओं को रोक सकता है — और हमें कभी पता भी नहीं चलेगा। लेकिन एक कमजोर मॉडल को पर्यवेक्षक के रूप में उपयोग करके इसे लगभग सर्वशक्तिमान स्तर तक प्रशिक्षित किया जा सकता है। यह निष्कर्ष AI संरेखण और मानव निगरानी की सीमाओं पर गंभीर प्रश्न उठाता है।

vLLM का Gemma 4 MTP के लिए Day-0 समर्थन, डिकोडिंग स्पीड 3 गुना

vLLM अब Google के Gemma 4 मॉडल के लिए Day-0 MTP समर्थन प्रदान करता है, जो मल्टी-टोकन पूर्वानुमान के माध्यम से गुणवत्ता में कमी के बिना 3 गुना तक डिकोडिंग त्वरण प्राप्त करता है, साथ ही उपयोग के लिए तैयार Docker इमेज भी प्रदान करता है। Gemma 4 एक MoE मल्टीमॉडल मॉडल है जिसके कुल 26B पैरामीटर और 4B सक्रिय पैरामीटर हैं।

Perplexity ने 35 विश्लेषण वर्कफ़्लो के साथ पेशेवर वित्तीय Computer लॉन्च किया

Perplexity Computer ने पेशेवर वित्त के लिए एक संस्करण जारी किया, जो Morningstar, PitchBook, Daloopa और Carbon Arc से लाइसेंस प्राप्त डेटा को एकीकृत करता है, और विश्लेषकों द्वारा दैनिक उपयोग किए जाने वाले 35 विशेष वर्कफ़्लो जोड़ता है।

OpenAI ने सैंडबॉक्स समर्थन के साथ TypeScript Agents SDK जारी किया

OpenAI Devs ने घोषणा की कि अपडेटेड Agents SDK अब TypeScript का समर्थन करता है, जिसमें सैंडबॉक्स एजेंट और ओपन-सोर्स हार्नेस शामिल हैं, जो डेवलपर्स के लिए एजेंट एप्लिकेशन बनाना आसान बनाता है।

Anthropic ने AI सामान्यीकरण को बढ़ावा देने के लिए Model Spec Midtraining प्रस्तावित किया

Anthropic ने Model Spec Midtraining (MSM) पर नया शोध जारी किया, जो पहले AI को वांछित सामान्यीकरण विधि और तर्क सिखाता है, नए परिदृश्यों में मानक संरेखण विधियों की विफलता को संबोधित करता है।


● लॉन्च और रिलीज़05·06
Luma Labs

Luma ने Uni-1.1 API लॉन्च किया, बुद्धिमान छवि तर्क मॉडल ऑनलाइन

Luma AI ने Uni-1.1 API पेश किया, जिसमें तर्क क्षमताएँ, सौंदर्य बोध और नियंत्रणीयता शामिल है, जो कस्टम पाइपलाइनों का समर्थन करता है। इसकी कीमत और विलंबता तुलनात्मक उत्पादों की तुलना में आधी है।

Luma Labs

Luma UNI-1.1 इमेज जनरेशन एरिना में छठे स्थान पर

Luma AI के UNI-1.1 और UNI-1.1 Max मॉडल टेक्स्ट-टू-इमेज एरिना लीडरबोर्ड पर क्रमशः छठे और सातवें स्थान पर हैं, जो 50 लाख से अधिक वोटों पर आधारित है।

Cursor

Cursor अब CI विफलताओं को स्वचालित रूप से ठीक कर सकता है

Cursor अब CI विफलताओं को स्वचालित रूप से ठीक कर सकता है, GitHub की निगरानी करने वाले हमेशा-सक्रिय एजेंट सेट करके, मूल कारणों की जाँच करके और स्वचालित PR बनाकर।

शोध पत्र

MolmoAct2: रोबोटिक्स के लिए ओपन-सोर्स एक्शन रीजनिंग मॉडल

MolmoAct2 रोबोट डिप्लॉयमेंट के लिए एक ओपन-सोर्स एक्शन रीजनिंग मॉडल है, जो सात सिमुलेशन और वास्तविक-दुनिया बेंचमार्क में Pi-05 जैसे बेसलाइन से बेहतर प्रदर्शन करता है।

उद्योग

LlamaIndex CB Insights AI 100 सूची में शामिल

CB Insights ने दसवीं वार्षिक AI 100 सूची जारी की, LlamaIndex को अग्रणी दस्तावेज़ समझ API प्रदाता के रूप में AI इंफ्रास्ट्रक्चर श्रेणी में शामिल किया गया।

StepFun

Step 3.5 Flash Lemonade कोडिंग एजेंट पर 14 दिनों के लिए मुफ़्त

StepFun का Step 3.5 Flash मॉडल अब Lemonade प्लेटफ़ॉर्म पर 14 दिनों के लिए मुफ़्त उपलब्ध है, जो Roblox गेम विकास के लिए एक विशेष कोडिंग एजेंट है।


Andrew Ng: कोडिंग एजेंट विभिन्न सॉफ़्टवेयर कार्यों को अलग-अलग गति से त्वरित करते हैं

Andrew Ng ने बताया कि कोडिंग एजेंट विभिन्न प्रकार के सॉफ़्टवेयर कार्यों को अलग-अलग डिग्री तक त्वरित करते हैं — फ्रंटएंड डेवलपमेंट सबसे अधिक त्वरित, फिर बैकएंड, और इंफ्रास्ट्रक्चर सबसे कम। इन अंतरों को समझने से टीम आर्किटेक्चर में यथार्थवादी अपेक्षाएँ निर्धारित करने में मदद मिलती है।

PVM: LVLM में लंबे अनुक्रम दृश्य संकेत क्षय का समाधान

पर्सिस्टेंट विज़ुअल मेमोरी (PVM) एक हल्का मॉड्यूल है जो फीडफ़ॉर्वर्ड नेटवर्क के समानांतर शाखा के रूप में काम करता है, दूरी-स्वतंत्र पुनर्प्राप्ति पथ स्थापित करके बड़े विज़ुअल लैंग्वेज मॉडल में लंबे अनुक्रम निर्माण के दौरान सटीक दृश्य धारणा बनाए रखता है।

Ctx2Skill: भाषा मॉडल को संदर्भ से स्वचालित रूप से कौशल सीखने की क्षमता

Ctx2Skill एक स्व-विकास ढांचा है, जो चैलेंजर, रीज़नर और जज एजेंटों के मल्टी-एजेंट स्व-खेल चक्र के माध्यम से बिना मानव एनोटेशन या बाहरी फीडबैक के जटिल संदर्भों से कौशल खोजता, परिष्कृत और चुनता है।

Hugging Face CEO: डेटासेट साझाकरण से AI एजेंट जटिल डेटा का विश्लेषण कर सकते हैं

Hugging Face के CEO ने उदाहरण द्वारा दिखाया कि प्लेटफ़ॉर्म पर डेटासेट साझा करने से AI एजेंट जटिल डेटा का विश्लेषण कर सकते हैं, जिससे सभी को जटिल जानकारी को समझने की क्षमता मिलती है।

Replit: एक दिन में 5 लाख प्रोजेक्ट, एक उपयोगकर्ता ने $10,000 एजेंट वर्कलोड खर्च किए

Replit के CEO ने बताया कि प्लेटफ़ॉर्म पर एक ही दिन में 5 लाख प्रोजेक्ट बनाए गए। एक उपयोगकर्ता ने एजेंट वर्कलोड पर $10,000 खर्च किए, जबकि दूसरे ने सैकड़ों व्यावसायिक विचारों की खोज की।

शोधकर्ता: सोशल मीडिया पोस्ट से लेकर पेपर तक, AI एजेंट अब हर लेखन की समीक्षा करते हैं

एक शोधकर्ता ने साझा किया कि वे अब LLM और एजेंट का उपयोग अपने सभी लेखन — सोशल मीडिया पोस्ट से लेकर शोध पत्रों तक — की समीक्षा के लिए करते हैं। AI सुझावों की उपयोगिता भिन्न होती है: कुछ सीधे उपयोगी होते हैं, अन्य रचनात्मक सोच को प्रेरित करते हैं।

"वास्तविक कॉन्टेक्स्ट कम्प्रेशन कभी आज़माया ही नहीं गया"

एक इंजीनियर ने तर्क दिया कि LLM में वास्तविक कॉन्टेक्स्ट कम्प्रेशन अभी तक प्रयास ही नहीं किया गया है, जो लंबे-कॉन्टेक्स्ट मॉडल की वर्तमान सीमाओं पर एक उत्तेजक दृष्टिकोण प्रस्तुत करता है।


● आज के संक्षिप्त समाचार05·06
vLLM

Gemma 4 MTP Day-0: 3x डिकोडिंग गति

vLLM ने Gemma 4 के लिए MTP समर्थन के साथ तैयार Docker इमेज जारी की।

OpenAI

Sam Altman: "नया instant मॉडल बहुत अच्छा है"

GPT-5.5 Instant के बारे में Altman ने कहा — "इसे ज़रूर आज़माएँ।"

रोबोटिक्स

MolmoAct2: ओपन-सोर्स एक्शन मॉडल

7 बेंचमार्क में Pi-05 से बेहतर, रोबोट डिप्लॉयमेंट के लिए तैयार।

Andrew Ng

फ्रंटएंड सबसे तेज़, इंफ्रा सबसे धीमा

कोडिंग एजेंट की विभिन्न कार्यों पर त्वरण गति का विश्लेषण।

CB Insights

LlamaIndex AI 100 में शामिल

दस्तावेज़ समझ API प्रदाता के रूप में AI इंफ्रा श्रेणी में चयनित।

Replit

एक दिन में 5 लाख प्रोजेक्ट

एक उपयोगकर्ता ने $10K एजेंट वर्कलोड खर्च किए।

Cursor

CI विफलता स्वचालित रूप से ठीक

GitHub मॉनिटरिंग एजेंट अब मूल कारण खोजकर PR बनाता है।

StepFun

Step 3.5 Flash, Lemonade पर मुफ़्त

Roblox गेम डेवलपमेंट के लिए 14-दिन का निःशुल्क परीक्षण।

शोध

Ctx2Skill: LLM स्वयं कौशल सीखें

मल्टी-एजेंट स्व-खेल से बिना मानव फीडबैक के स्वचालित कौशल खोज।

Hugging Face

डेटासेट से AI एजेंट सशक्त

खुले डेटासेट एजेंटों को जटिल विश्लेषण करने में सक्षम बनाते हैं।