Anthropic अध्ययन: कमजोर मॉडल से लगभग सर्वशक्तिमान AI का प्रशिक्षण संभव
Anthropic के नए शोध में पाया गया कि AI कार्यों में जिन्हें मनुष्य पूरी तरह से जाँच नहीं कर सकते, एक सक्षम मॉडल जानबूझकर क्षमताओं को रोक सकता है — और हमें कभी पता भी नहीं चलेगा। लेकिन एक कमजोर मॉडल को पर्यवेक्षक के रूप में उपयोग करके इसे लगभग सर्वशक्तिमान स्तर तक प्रशिक्षित किया जा सकता है। यह निष्कर्ष AI संरेखण और मानव निगरानी की सीमाओं पर गंभीर प्रश्न उठाता है।
vLLM का Gemma 4 MTP के लिए Day-0 समर्थन, डिकोडिंग स्पीड 3 गुना
vLLM अब Google के Gemma 4 मॉडल के लिए Day-0 MTP समर्थन प्रदान करता है, जो मल्टी-टोकन पूर्वानुमान के माध्यम से गुणवत्ता में कमी के बिना 3 गुना तक डिकोडिंग त्वरण प्राप्त करता है, साथ ही उपयोग के लिए तैयार Docker इमेज भी प्रदान करता है। Gemma 4 एक MoE मल्टीमॉडल मॉडल है जिसके कुल 26B पैरामीटर और 4B सक्रिय पैरामीटर हैं।
Perplexity ने 35 विश्लेषण वर्कफ़्लो के साथ पेशेवर वित्तीय Computer लॉन्च किया
Perplexity Computer ने पेशेवर वित्त के लिए एक संस्करण जारी किया, जो Morningstar, PitchBook, Daloopa और Carbon Arc से लाइसेंस प्राप्त डेटा को एकीकृत करता है, और विश्लेषकों द्वारा दैनिक उपयोग किए जाने वाले 35 विशेष वर्कफ़्लो जोड़ता है।
OpenAI ने सैंडबॉक्स समर्थन के साथ TypeScript Agents SDK जारी किया
OpenAI Devs ने घोषणा की कि अपडेटेड Agents SDK अब TypeScript का समर्थन करता है, जिसमें सैंडबॉक्स एजेंट और ओपन-सोर्स हार्नेस शामिल हैं, जो डेवलपर्स के लिए एजेंट एप्लिकेशन बनाना आसान बनाता है।
Anthropic ने AI सामान्यीकरण को बढ़ावा देने के लिए Model Spec Midtraining प्रस्तावित किया
Anthropic ने Model Spec Midtraining (MSM) पर नया शोध जारी किया, जो पहले AI को वांछित सामान्यीकरण विधि और तर्क सिखाता है, नए परिदृश्यों में मानक संरेखण विधियों की विफलता को संबोधित करता है।
ComboStoc: डिफ्यूज़न मॉडल प्रशिक्षण को तेज़ करने के लिए संयोजक यादृच्छिकता
ComboStoc एक संयोजक यादृच्छिकता विधि प्रस्तावित करता है, जो आयाम और गुण संयोजन स्थानों को बेहतर ढंग से कवर करके इमेज और 3D शेप जैसे मल्टी-मॉडल डिफ्यूज़न मॉडल के प्रशिक्षण को तेज़ करता है, बिना जटिल मॉडल पुनर्निर्माण की आवश्यकता के।
Luma ने Uni-1.1 API लॉन्च किया, बुद्धिमान छवि तर्क मॉडल ऑनलाइन
Luma AI ने Uni-1.1 API पेश किया, जिसमें तर्क क्षमताएँ, सौंदर्य बोध और नियंत्रणीयता शामिल है, जो कस्टम पाइपलाइनों का समर्थन करता है। इसकी कीमत और विलंबता तुलनात्मक उत्पादों की तुलना में आधी है।
Luma UNI-1.1 इमेज जनरेशन एरिना में छठे स्थान पर
Luma AI के UNI-1.1 और UNI-1.1 Max मॉडल टेक्स्ट-टू-इमेज एरिना लीडरबोर्ड पर क्रमशः छठे और सातवें स्थान पर हैं, जो 50 लाख से अधिक वोटों पर आधारित है।
Cursor अब CI विफलताओं को स्वचालित रूप से ठीक कर सकता है
Cursor अब CI विफलताओं को स्वचालित रूप से ठीक कर सकता है, GitHub की निगरानी करने वाले हमेशा-सक्रिय एजेंट सेट करके, मूल कारणों की जाँच करके और स्वचालित PR बनाकर।
MolmoAct2: रोबोटिक्स के लिए ओपन-सोर्स एक्शन रीजनिंग मॉडल
MolmoAct2 रोबोट डिप्लॉयमेंट के लिए एक ओपन-सोर्स एक्शन रीजनिंग मॉडल है, जो सात सिमुलेशन और वास्तविक-दुनिया बेंचमार्क में Pi-05 जैसे बेसलाइन से बेहतर प्रदर्शन करता है।
LlamaIndex CB Insights AI 100 सूची में शामिल
CB Insights ने दसवीं वार्षिक AI 100 सूची जारी की, LlamaIndex को अग्रणी दस्तावेज़ समझ API प्रदाता के रूप में AI इंफ्रास्ट्रक्चर श्रेणी में शामिल किया गया।
Step 3.5 Flash Lemonade कोडिंग एजेंट पर 14 दिनों के लिए मुफ़्त
StepFun का Step 3.5 Flash मॉडल अब Lemonade प्लेटफ़ॉर्म पर 14 दिनों के लिए मुफ़्त उपलब्ध है, जो Roblox गेम विकास के लिए एक विशेष कोडिंग एजेंट है।
Andrew Ng: कोडिंग एजेंट विभिन्न सॉफ़्टवेयर कार्यों को अलग-अलग गति से त्वरित करते हैं
Andrew Ng ने बताया कि कोडिंग एजेंट विभिन्न प्रकार के सॉफ़्टवेयर कार्यों को अलग-अलग डिग्री तक त्वरित करते हैं — फ्रंटएंड डेवलपमेंट सबसे अधिक त्वरित, फिर बैकएंड, और इंफ्रास्ट्रक्चर सबसे कम। इन अंतरों को समझने से टीम आर्किटेक्चर में यथार्थवादी अपेक्षाएँ निर्धारित करने में मदद मिलती है।
PVM: LVLM में लंबे अनुक्रम दृश्य संकेत क्षय का समाधान
पर्सिस्टेंट विज़ुअल मेमोरी (PVM) एक हल्का मॉड्यूल है जो फीडफ़ॉर्वर्ड नेटवर्क के समानांतर शाखा के रूप में काम करता है, दूरी-स्वतंत्र पुनर्प्राप्ति पथ स्थापित करके बड़े विज़ुअल लैंग्वेज मॉडल में लंबे अनुक्रम निर्माण के दौरान सटीक दृश्य धारणा बनाए रखता है।
Ctx2Skill: भाषा मॉडल को संदर्भ से स्वचालित रूप से कौशल सीखने की क्षमता
Ctx2Skill एक स्व-विकास ढांचा है, जो चैलेंजर, रीज़नर और जज एजेंटों के मल्टी-एजेंट स्व-खेल चक्र के माध्यम से बिना मानव एनोटेशन या बाहरी फीडबैक के जटिल संदर्भों से कौशल खोजता, परिष्कृत और चुनता है।
Hugging Face CEO: डेटासेट साझाकरण से AI एजेंट जटिल डेटा का विश्लेषण कर सकते हैं
Hugging Face के CEO ने उदाहरण द्वारा दिखाया कि प्लेटफ़ॉर्म पर डेटासेट साझा करने से AI एजेंट जटिल डेटा का विश्लेषण कर सकते हैं, जिससे सभी को जटिल जानकारी को समझने की क्षमता मिलती है।
Replit: एक दिन में 5 लाख प्रोजेक्ट, एक उपयोगकर्ता ने $10,000 एजेंट वर्कलोड खर्च किए
Replit के CEO ने बताया कि प्लेटफ़ॉर्म पर एक ही दिन में 5 लाख प्रोजेक्ट बनाए गए। एक उपयोगकर्ता ने एजेंट वर्कलोड पर $10,000 खर्च किए, जबकि दूसरे ने सैकड़ों व्यावसायिक विचारों की खोज की।
शोधकर्ता: सोशल मीडिया पोस्ट से लेकर पेपर तक, AI एजेंट अब हर लेखन की समीक्षा करते हैं
एक शोधकर्ता ने साझा किया कि वे अब LLM और एजेंट का उपयोग अपने सभी लेखन — सोशल मीडिया पोस्ट से लेकर शोध पत्रों तक — की समीक्षा के लिए करते हैं। AI सुझावों की उपयोगिता भिन्न होती है: कुछ सीधे उपयोगी होते हैं, अन्य रचनात्मक सोच को प्रेरित करते हैं।
"वास्तविक कॉन्टेक्स्ट कम्प्रेशन कभी आज़माया ही नहीं गया"
एक इंजीनियर ने तर्क दिया कि LLM में वास्तविक कॉन्टेक्स्ट कम्प्रेशन अभी तक प्रयास ही नहीं किया गया है, जो लंबे-कॉन्टेक्स्ट मॉडल की वर्तमान सीमाओं पर एक उत्तेजक दृष्टिकोण प्रस्तुत करता है।
Gemma 4 MTP Day-0: 3x डिकोडिंग गति
vLLM ने Gemma 4 के लिए MTP समर्थन के साथ तैयार Docker इमेज जारी की।
Sam Altman: "नया instant मॉडल बहुत अच्छा है"
GPT-5.5 Instant के बारे में Altman ने कहा — "इसे ज़रूर आज़माएँ।"
MolmoAct2: ओपन-सोर्स एक्शन मॉडल
7 बेंचमार्क में Pi-05 से बेहतर, रोबोट डिप्लॉयमेंट के लिए तैयार।
फ्रंटएंड सबसे तेज़, इंफ्रा सबसे धीमा
कोडिंग एजेंट की विभिन्न कार्यों पर त्वरण गति का विश्लेषण।
LlamaIndex AI 100 में शामिल
दस्तावेज़ समझ API प्रदाता के रूप में AI इंफ्रा श्रेणी में चयनित।
एक दिन में 5 लाख प्रोजेक्ट
एक उपयोगकर्ता ने $10K एजेंट वर्कलोड खर्च किए।
CI विफलता स्वचालित रूप से ठीक
GitHub मॉनिटरिंग एजेंट अब मूल कारण खोजकर PR बनाता है।
Step 3.5 Flash, Lemonade पर मुफ़्त
Roblox गेम डेवलपमेंट के लिए 14-दिन का निःशुल्क परीक्षण।
Ctx2Skill: LLM स्वयं कौशल सीखें
मल्टी-एजेंट स्व-खेल से बिना मानव फीडबैक के स्वचालित कौशल खोज।
डेटासेट से AI एजेंट सशक्त
खुले डेटासेट एजेंटों को जटिल विश्लेषण करने में सक्षम बनाते हैं।