5 मई 2026 · मंगलवार

Runway ने रियल-टाइम वीडियो एजेंट लॉन्च किया: एक तस्वीर से 24fps HD संवादी वीडियो

Runway ने Runway Characters पेश किया, जो एक तस्वीर को पूर्ण अभिव्यक्ति वाले, संवादी रियल-टाइम वीडियो एजेंट में बदल देता है, जो 24fps HD पर स्ट्रीम होता है और एंड-टू-एंड विलंबता केवल 1.75 सेकंड है।

Runway Characters — एक स्थिर छवि सजीव AI किरदार बन जाती है, HD 24fps पर वास्तविक बातचीत।

रनवे ने वीडियो एजेंट तकनीक में एक नया मील का पत्थर स्थापित किया है। Runway Characters केवल एक स्थिर छवि को लेकर एक पूर्णतः अभिव्यंजक, संवाद करने में सक्षम डिजिटल चरित्र में बदल देता है। यह प्रणाली 24 फ्रेम प्रति सेकंड की दर से हाई-डेफिनिशन वीडियो स्ट्रीम करती है, और संपूर्ण प्रक्रिया — इनपुट से लेकर आउटपुट तक — मात्र 1.75 सेकंड में पूरी होती है। यह रियल-टाइम इंटरैक्टिव वीडियो अनुभव के लिए एक महत्वपूर्ण छलांग है। क्रिएटिव इंडस्ट्री, गेमिंग, वर्चुअल असिस्टेंट और डिजिटल मनोरंजन में इसके अनुप्रयोगों की अपार संभावनाएँ हैं।




हमें अभी भी एक सच्चा 1M-कॉन्टेक्स्ट मॉडल नहीं मिला — यह एक असामान्य स्थिति है जहाँ इंफ्रास्ट्रक्चर विज्ञान से कहीं आगे है। क्या हमारे पास सही डेटा या प्रशिक्षण तकनीक नहीं है?

@jxmnop

GPU प्रदर्शन

GB300 Ultra NVL72 GB200 NVL72 से 2.7 गुना तेज़

SemiAnalysis रिपोर्ट करता है कि GB300 Ultra NVL72 उद्योग-मानक इंफ़रेंस बेंचमार्क पर GB200 NVL72 से 2.7 गुना तेज़ है, जो एक महत्वपूर्ण प्रदर्शन उछाल है।

आर्किटेक्चर

DeepSeek-V4: KV कैश 90% घटा, मिलियन टोकन कॉन्टेक्स्ट सपोर्ट

DeepSeek-V4 मिक्स्ड अटेंशन और स्पार्स MoE आर्किटेक्चर का उपयोग करता है, जो मिलियन टोकन के कॉन्टेक्स्ट लंबाई को सपोर्ट करने के लिए KV कैश को 90% तक कम करता है।

उद्योग

Nathan Lambert ने API हमलों और डिस्टिलेशन के बीच अंतर का आह्वान किया

जेलब्रोकन API के माध्यम से चीनी प्रयोगशालाओं द्वारा मॉडल सिग्नल निकालने को 'डिस्टिलेशन अटैक' कहना डिस्टिलेशन की तकनीक को कलंकित करता है।

क्रिएटिव AI

Luma ने क्रिएटिव एजेंट लॉन्च किया: विचारों को पूर्ण विज्ञापन सिस्टम में बदले

Luma Agents उपयोगकर्ता द्वारा परिभाषित अवधारणाओं के आसपास योजना, निर्माण से लेकर पुनरावृत्त अनुकूलन तक की पूरी प्रक्रिया को स्वचालित रूप से पूरा करते हैं।

मॉडल रिलीज़

nanowhale: एजेंट द्वारा पूरी तरह से प्रीट्रेंड किया गया DeepSeek मॉडल

Karpathy के nanochat से प्रेरित, nanowhale एक छोटा DeepSeek मॉडल है जो पूरी तरह से एक एजेंट द्वारा प्रीट्रेंड किया गया है, जो स्वचालित मॉडल प्रशिक्षण में नई दिशा दिखाता है।

मॉडल रिलीज़

IBM Granite 4.1-8B 8–16GB वीआरएएम हार्डवेयर के लिए ऑप्टिमाइज़

IBM Granite 4.1-8B मॉडल Hugging Face पर ओपन-सोर्स किया गया, जो 8 से 16GB VRAM वाले हार्डवेयर के लिए अनुकूलित है और ओपन-सोर्स AI को आगे बढ़ाता है।

AI इंफ्रास्ट्रक्चर

NVIDIA: AI पाँच-परत केक — ऊर्जा, चिप, इंफ्रा, मॉडल, ऐप

NVIDIA ने AI इंफ्रास्ट्रक्चर को पाँच परतों में परिभाषित किया, और जो देश-कंपनियाँ पूर्ण स्टैक बनाएँगी वे अगले औद्योगिक युग को परिभाषित करेंगी।

शिक्षा

François Chollet की 'Deep Learning with Python' अब निःशुल्क ऑनलाइन

12 हजार प्रतियाँ बिकने और लाखों डाउनलोड के बाद Chollet ने अपनी प्रभावशाली डीप लर्निंग पुस्तक को मुफ़्त ऑनलाइन पढ़ने के लिए उपलब्ध कराया।

टूलिंग

XGrammar-2: जटिल एजेंट फ्रेमवर्क के लिए संरचित जनरेशन

XGrammar-2 सख्त टूल-कॉलिंग फ़ॉर्मेट और बिल्ट-इन DeepSeek इंटीग्रेशन के साथ एजेंट हार्नेस के लिए संरचित जनरेशन प्रदान करता है।

शोध पत्र

Web2BigTable: इंटरनेट-स्केल सूचना निष्कर्षण हेतु बाई-लेवल एजेंट

Web2BigTable एक डबल-लेयर मल्टी-एजेंट फ्रेमवर्क है जो WideSearch बेंचमार्क पर Avg@4 सफलता दर 38.50 प्राप्त करता है, जबकि दूसरा स्थान मात्र 5.10 पर है।

वीडियो जनरेशन

UniVidX: डिफ्यूज़न प्रायर द्वारा एकीकृत बहुविध वीडियो जनरेशन

UniVidX एक यूनिफाइड मल्टीमॉडल फ्रेमवर्क है जो वीडियो डिफ्यूज़न मॉडल प्रायर का उपयोग कर RGB और RGBA लेयर सिंथेसिस में SOTA प्रदर्शन प्राप्त करता है।

उत्पाद

Replit: बिना स्लाइड छुए संपूर्ण प्रेज़ेंटेशन बनाएँ, PPTX में निर्यात करें

Replit में अब केवल विवरण देकर पूरा पिच डेक बनाएँ, चैट में संपादित करें, और PPTX, Google Slides या PDF में निर्यात करें।


एजेंट और अनुप्रयोग05 · 05
मॉडल

Qwen 3.6: 12GB VRAM पर हाई TPS कॉन्फ़िगरेशन

समुदाय ने Qwen 3.6 के लिए ऐसे कॉन्फ़िग साझा किए हैं जो मात्र 12GB VRAM पर उच्च टोकन-प्रति-सेकंड गति प्रदान करते हैं।

LLM

Grok 4.3 ने एक प्रॉम्प्ट से पूरा गेम बनाया, स्पीड में Claude Sonnet को पीछे छोड़ा

एक उपयोगकर्ता ने Grok 4.3 से एक ही प्रॉम्प्ट में संपूर्ण गेम तैयार करवाया, जिसकी आउटपुट टोकन गति सबसे तेज़ रही।

AI शिक्षा

मूक-बधिर छात्रों के लिए बहुविध AI शिक्षण मंच

Replit के CEO Amjad Masad ने AI-संचालित बहुविध शिक्षण मंच की सराहना की जो मूक-बधिर छात्रों को सशक्त बनाता है।

एजेंट

Replit पर सर्वाधिक एजेंटिक समानांतरता: 10 सक्रिय, 198 ड्राफ़्ट, 700+ पूर्ण

Amjad Masad के अनुसार इंटरनेट पर किसी अन्य प्लेटफ़ॉर्म पर Replit जितनी एजेंटिक समानांतरता नहीं हो रही है।

AI सुरक्षा

Anthropic सह-संस्थापक Jack Clark: 2028 तक RSI की 60% संभावना

Anthropic के सह-संस्थापक Jack Clark ने 2028 के अंत तक रिकर्सिव सेल्फ-इम्प्रूवमेंट की 60% संभावना व्यक्त की है।

टूल

Hugging Face मॉडल विज़ुअलाइज़र: URL डालें और आर्किटेक्चर देखें

एक नया HF मॉडल विज़ुअलाइज़ेशन टूल उपयोगकर्ताओं को किसी भी ग्रैन्युलैरिटी पर मॉडल संरचना को एक्सप्लोर करने की सुविधा देता है।