
xAI ने Grok Voice API वॉयस क्लोनिंग फीचर लॉन्च किया
xAI ने Grok Voice API के लिए वॉयस क्लोनिंग फीचर जारी किया, जो छोटी ऑडियो रिकॉर्डिंग से प्राकृतिक भावनाओं वाली आवाज़ को क्लोन करने और कंसोल के माध्यम से वॉयस लाइब्रेरी प्रबंधित करने की सुविधा देता है, जिससे ब्रांड के लिए व्यक्तिगत वॉयस कस्टमाइज़ेशन संभव होता है।

Ollama ने Claude Desktop को सपोर्ट किया, थर्ड-पार्टी इंफ़रेंस खोला
Ollama अब Claude Desktop के बिल्ट-इन थर्ड-पार्टी इंफ़रेंस फीचर के माध्यम से सभी Ollama Cloud मॉडलों को सपोर्ट करता है, जिसमें Claude Cowork और Claude Code शामिल हैं। यह एकीकरण ओपन-सोर्स मॉडलों को एंटरप्राइज़ वर्कफ़्लो से जोड़ने की दिशा में एक बड़ा कदम है।
Vercel ने डीप सिक्योरिटी रिव्यू के लिए ओपन-सोर्स एजेंट ऑर्केस्ट्रेटर deepsec लॉन्च किया
Vercel के CEO ने ओपन-सोर्स एजेंट ऑर्केस्ट्रेटर deepsec की घोषणा की, जो गहन सुरक्षा समीक्षा के लिए डिज़ाइन किया गया है और कई प्रमुख OSS प्रोजेक्ट्स पर इसकी प्रभावशीलता को मान्य किया गया है। यह टूल कोडिंग एजेंटों को सुरक्षा कमज़ोरियों का गहन विश्लेषण करने में सक्षम बनाता है।
Perplexity Computer का Microsoft Teams के साथ एकीकरण

Perplexity Computer अब Microsoft Teams में उपलब्ध है, जो Teams वर्कस्पेस के भीतर सीधे शोध, विश्लेषण और दस्तावेज़ निर्माण की अनुमति देता है।
हमें अभी भी एक सच्चा 1M-कॉन्टेक्स्ट मॉडल नहीं मिला — यह एक असामान्य स्थिति है जहाँ इंफ्रास्ट्रक्चर विज्ञान से कहीं आगे है। क्या हमारे पास सही डेटा या प्रशिक्षण तकनीक नहीं है?
@jxmnop
GB300 Ultra NVL72 GB200 NVL72 से 2.7 गुना तेज़
SemiAnalysis रिपोर्ट करता है कि GB300 Ultra NVL72 उद्योग-मानक इंफ़रेंस बेंचमार्क पर GB200 NVL72 से 2.7 गुना तेज़ है, जो एक महत्वपूर्ण प्रदर्शन उछाल है।
DeepSeek-V4: KV कैश 90% घटा, मिलियन टोकन कॉन्टेक्स्ट सपोर्ट
DeepSeek-V4 मिक्स्ड अटेंशन और स्पार्स MoE आर्किटेक्चर का उपयोग करता है, जो मिलियन टोकन के कॉन्टेक्स्ट लंबाई को सपोर्ट करने के लिए KV कैश को 90% तक कम करता है।
Nathan Lambert ने API हमलों और डिस्टिलेशन के बीच अंतर का आह्वान किया
जेलब्रोकन API के माध्यम से चीनी प्रयोगशालाओं द्वारा मॉडल सिग्नल निकालने को 'डिस्टिलेशन अटैक' कहना डिस्टिलेशन की तकनीक को कलंकित करता है।
Luma ने क्रिएटिव एजेंट लॉन्च किया: विचारों को पूर्ण विज्ञापन सिस्टम में बदले
Luma Agents उपयोगकर्ता द्वारा परिभाषित अवधारणाओं के आसपास योजना, निर्माण से लेकर पुनरावृत्त अनुकूलन तक की पूरी प्रक्रिया को स्वचालित रूप से पूरा करते हैं।
nanowhale: एजेंट द्वारा पूरी तरह से प्रीट्रेंड किया गया DeepSeek मॉडल
Karpathy के nanochat से प्रेरित, nanowhale एक छोटा DeepSeek मॉडल है जो पूरी तरह से एक एजेंट द्वारा प्रीट्रेंड किया गया है, जो स्वचालित मॉडल प्रशिक्षण में नई दिशा दिखाता है।
IBM Granite 4.1-8B 8–16GB वीआरएएम हार्डवेयर के लिए ऑप्टिमाइज़
IBM Granite 4.1-8B मॉडल Hugging Face पर ओपन-सोर्स किया गया, जो 8 से 16GB VRAM वाले हार्डवेयर के लिए अनुकूलित है और ओपन-सोर्स AI को आगे बढ़ाता है।
NVIDIA: AI पाँच-परत केक — ऊर्जा, चिप, इंफ्रा, मॉडल, ऐप
NVIDIA ने AI इंफ्रास्ट्रक्चर को पाँच परतों में परिभाषित किया, और जो देश-कंपनियाँ पूर्ण स्टैक बनाएँगी वे अगले औद्योगिक युग को परिभाषित करेंगी।
François Chollet की 'Deep Learning with Python' अब निःशुल्क ऑनलाइन
12 हजार प्रतियाँ बिकने और लाखों डाउनलोड के बाद Chollet ने अपनी प्रभावशाली डीप लर्निंग पुस्तक को मुफ़्त ऑनलाइन पढ़ने के लिए उपलब्ध कराया।
XGrammar-2: जटिल एजेंट फ्रेमवर्क के लिए संरचित जनरेशन
XGrammar-2 सख्त टूल-कॉलिंग फ़ॉर्मेट और बिल्ट-इन DeepSeek इंटीग्रेशन के साथ एजेंट हार्नेस के लिए संरचित जनरेशन प्रदान करता है।
Web2BigTable: इंटरनेट-स्केल सूचना निष्कर्षण हेतु बाई-लेवल एजेंट
Web2BigTable एक डबल-लेयर मल्टी-एजेंट फ्रेमवर्क है जो WideSearch बेंचमार्क पर Avg@4 सफलता दर 38.50 प्राप्त करता है, जबकि दूसरा स्थान मात्र 5.10 पर है।
UniVidX: डिफ्यूज़न प्रायर द्वारा एकीकृत बहुविध वीडियो जनरेशन
UniVidX एक यूनिफाइड मल्टीमॉडल फ्रेमवर्क है जो वीडियो डिफ्यूज़न मॉडल प्रायर का उपयोग कर RGB और RGBA लेयर सिंथेसिस में SOTA प्रदर्शन प्राप्त करता है।
Replit: बिना स्लाइड छुए संपूर्ण प्रेज़ेंटेशन बनाएँ, PPTX में निर्यात करें
Replit में अब केवल विवरण देकर पूरा पिच डेक बनाएँ, चैट में संपादित करें, और PPTX, Google Slides या PDF में निर्यात करें।
Qwen 3.6: 12GB VRAM पर हाई TPS कॉन्फ़िगरेशन
समुदाय ने Qwen 3.6 के लिए ऐसे कॉन्फ़िग साझा किए हैं जो मात्र 12GB VRAM पर उच्च टोकन-प्रति-सेकंड गति प्रदान करते हैं।
Grok 4.3 ने एक प्रॉम्प्ट से पूरा गेम बनाया, स्पीड में Claude Sonnet को पीछे छोड़ा
एक उपयोगकर्ता ने Grok 4.3 से एक ही प्रॉम्प्ट में संपूर्ण गेम तैयार करवाया, जिसकी आउटपुट टोकन गति सबसे तेज़ रही।
मूक-बधिर छात्रों के लिए बहुविध AI शिक्षण मंच
Replit के CEO Amjad Masad ने AI-संचालित बहुविध शिक्षण मंच की सराहना की जो मूक-बधिर छात्रों को सशक्त बनाता है।
Replit पर सर्वाधिक एजेंटिक समानांतरता: 10 सक्रिय, 198 ड्राफ़्ट, 700+ पूर्ण
Amjad Masad के अनुसार इंटरनेट पर किसी अन्य प्लेटफ़ॉर्म पर Replit जितनी एजेंटिक समानांतरता नहीं हो रही है।
Anthropic सह-संस्थापक Jack Clark: 2028 तक RSI की 60% संभावना
Anthropic के सह-संस्थापक Jack Clark ने 2028 के अंत तक रिकर्सिव सेल्फ-इम्प्रूवमेंट की 60% संभावना व्यक्त की है।
Hugging Face मॉडल विज़ुअलाइज़र: URL डालें और आर्किटेक्चर देखें
एक नया HF मॉडल विज़ुअलाइज़ेशन टूल उपयोगकर्ताओं को किसी भी ग्रैन्युलैरिटी पर मॉडल संरचना को एक्सप्लोर करने की सुविधा देता है।
