13 मई 2026 · बुधवार

Isomorphic Labs को AI दवा खोज में तेजी लाने के लिए 2.1 बिलियन डॉलर की फंडिंग मिली

Demis Hassabis ने घोषणा की कि उनकी AI दवा खोज कंपनी Isomorphic Labs ने 2.1 बिलियन डॉलर जुटाए, जिसका लक्ष्य सभी बीमारियों का समाधान करना और मानव स्वास्थ्य के लिए AI को प्राथमिक अनुप्रयोग बनाना है।

Demis Hassabis — AI के साथ दवा खोज की नई कल्पना

Google DeepMind के संस्थापक Demis Hassabis ने घोषणा की कि उनकी AI-संचालित दवा खोज कंपनी Isomorphic Labs ने 2.1 बिलियन डॉलर की नई फंडिंग जुटाई है। यह फंडिंग दौर कंपनी के मिशन को गति देगा: AI के माध्यम से सभी बीमारियों का समाधान खोजना। Hassabis का मानना है कि AI का सबसे महत्वपूर्ण उपयोग मानव स्वास्थ्य में सुधार होना चाहिए — एक दृष्टि जो AlphaFold से शुरू हुई थी और अब Isomorphic Labs के माध्यम से नई ऊँचाइयों को छू रही है।

Google ने Android पर Gemini Intelligence पेश किया

Google CEO Sundar Pichai ने Android Show में Gemini Intelligence की घोषणा की, जो ऐप्स और Chrome में मल्टी-स्टेप कार्यों को स्वचालित करता है।

Google ने Gemini Intelligence लॉन्च किया, जो सबसे उन्नत Android उपकरणों पर Gemini की क्षमताओं को लाता है। यह सिस्टम ऐप्स और Chrome के पार मल्टी-स्टेप कार्यों को स्वचालित कर सकता है, सिंगल-टैप से फॉर्म भर सकता है, और Rambler के माध्यम से बोले गए विचारों को परिष्कृत टेक्स्ट में बदल सकता है।

Perplexity ने Blackwell GPU पर Qwen3 235B का अनुमान प्रदर्शन अध्ययन प्रकाशित किया

Perplexity AI ने शोध जारी किया जो दिखाता है कि NVIDIA GB200 NVL72 Blackwell प्लेटफॉर्म पर Qwen3 235B मॉडल की सेवा से Hopper की तुलना में थ्रूपुट में उल्लेखनीय वृद्धि होती है।

Perplexity AI ने नया शोध प्रकाशित किया है जो दर्शाता है कि NVIDIA GB200 NVL72 Blackwell रैक पर प्रशिक्षणोपरांत Qwen3 235B मॉडल की सेवा कैसे की जाती है। GB200, बड़े MoE मॉडलों के लिए उच्च-थ्रूपुट अनुमान में Hopper से एक बड़ा कदम है, केवल एक प्रशिक्षण प्लेटफॉर्म नहीं। Perplexity के CEO Arav Srinivas ने बताया कि GB200 बड़े MoE मॉडलों की प्रीफिल और डीकोड अलगाव को बदल देता है।

Step Image Edit 2 — KRIS-Bench पर शीर्ष प्रदर्शन करने वाला इमेज एडिटिंग मॉडल

StepFun ने Step Image Edit 2 लॉन्च किया, KRIS-Bench पर शीर्ष पर

Stepfun ने 3.5B पैरामीटर वाला इमेज एडिटिंग मॉडल Step Image Edit 2 पेश किया, जो निर्देश-आधारित इमेज एडिटिंग के प्रमुख बेंचमार्क KRIS-Bench पर समग्र, तथ्यात्मक और अवधारणात्मक श्रेणियों में पहले स्थान पर रहा। यह मॉडल 5-6 गुना अधिक पैरामीटर वाले मॉडलों से बेहतर प्रदर्शन करता है और अनुमान में केवल 0.7 सेकंड लगते हैं।

Claude Opus 4.7 फ़ास्ट मोड रिसर्च प्रीव्यू के रूप में खुला

Anthropic ने Claude Opus 4.7 के लिए फ़ास्ट मोड पेश किया, जो API और Claude Code के माध्यम से रिसर्च प्रीव्यू के रूप में उपलब्ध है। यह मोड मानक गति से 2.5x तेज़ है, हालांकि लागत 6x अधिक है। Cursor और v0 प्लेटफ़ॉर्म ने भी इस फ़ास्ट मोड का समर्थन शुरू कर दिया है।

Google DeepMind ने AI से माउस पॉइंटर इंटरैक्शन की नई कल्पना की

Google DeepMind ने एक प्रायोगिक AI पॉइंटर दिखाया जो गति, आवाज और प्राकृतिक शॉर्टहैंड को मिलाकर उपयोगकर्ताओं को स्क्रीन पर Gemini को सहज रूप से निर्देशित करने देता है। यह 50 साल पुराने माउस पॉइंटर इंटरफ़ेस का AI-संचालित पुनर्आविष्कार है।

Hugging Face Hub पर सार्वजनिक डेटासेट 1 मिलियन के पार

Hugging Face ने घोषणा की कि उसके Hub पर सार्वजनिक डेटासेट की संख्या 1 मिलियन तक पहुँच गई है। CEO Clement Delangue ने कहा कि यह AI समुदाय की अविश्वसनीय ताकत को दर्शाता है और खुले मॉडलों को खुले डेटा की आवश्यकता होती है। HF का बुनियादी ढाँचा अब पेटाबाइट्स डेटा उपलब्ध कराता है।

Meta ने चुपचाप Sapiens2 हाई-रेज़ोल्यूशन मानव मॉडल परिवार जारी किया

Meta ने Sapiens2 लॉन्च किया, जो 1 बिलियन मानव छवियों पर प्रशिक्षित उच्च-रिज़ॉल्यूशन मॉडलों का एक परिवार है। यह मॉडल मुद्रा अनुमान, विभाजन और गहराई अनुमान जैसे कार्यों के लिए डिज़ाइन किया गया है, और इसे बिना किसी बड़े प्रचार के चुपचाप जारी कर दिया गया।

François Chollet का कहना है कि प्रतीकात्मक शिक्षा एक नया स्केलेबल लर्निंग सब्सट्रेट है

Keras के निर्माता François Chollet ने स्पष्ट किया कि उनकी प्रतीकात्मक शिक्षण अवधारणा प्रोग्रामिंग एजेंटों को बदलने के बारे में नहीं है, बल्कि ग्रेडिएंट डिसेंट और तंत्रिका नेटवर्क को एक सामान्य, अत्यधिक स्केलेबल नई शिक्षण पद्धति से बदलने का लक्ष्य रखती है।

ModernColBERT ने मात्र 149M पैरामीटर के साथ BrowseComp-Plus को लगभग हल किया

Reason-ModernColBERT ने केवल 149M पैरामीटर के साथ BrowseComp-Plus बेंचमार्क पर SOTA को ध्वस्त कर दिया, और 54 गुना बड़े मॉडलों से बेहतर प्रदर्शन किया। यह दर्शाता है कि कुशल आर्किटेक्चर के साथ छोटे मॉडल भी बड़े पैमाने के मॉडलों को पीछे छोड़ सकते हैं।

AI बड़े पैमाने पर बेरोजगारी नहीं लाएगा। ऐसी दहशत फैलाने वाली कहानियाँ गैर-जिम्मेदाराना और हानिकारक हैं। प्रौद्योगिकी लहरें अंततः अधिक नौकरियाँ पैदा करती हैं।

— Andrew Ng, AI Fund के संस्थापक

OpenAI Codex अब बैकग्राउंड में क्रॉस-ऐप कंप्यूटर नियंत्रण कर सकता है

OpenAI डेवलपर टीम ने बताया कि Codex का Computer use फीचर बिना Mac पर पूर्ण नियंत्रण लिए ऐप्स के बीच क्लिक, टाइप और लगातार काम कर सकता है, सब बैकग्राउंड में चलता है। इससे एजेंट आपके काम करते समय पृष्ठभूमि में कार्य जारी रख सकते हैं।

OpenAI ने Symphony लॉन्च किया: हर कार्य के लिए समर्पित Codex एजेंट

OpenAI ने Symphony की घोषणा की, जो प्रत्येक टू-डू कार्य को एक चालू Codex एजेंट सौंपता है, जिससे पूर्ण स्वचालन संभव होता है। यह हर खुले कार्य के लिए समर्पित एजेंट प्रदान करता है।

मॉडल और उत्पाद13.05

मॉडल

पूर्व OpenAI CTO की कंपनी ने मल्टीमॉडल रीयल-टाइम इंटरैक्टिव मॉडल लॉन्च किया

Mira Murati की Thinking Machines ने एक इंटरैक्टिव मॉडल प्रस्तुत किया जो लगातार ऑडियो, वीडियो, टेक्स्ट ग्रहण कर रीयल टाइम में सोचता और कार्य करता है, पारंपरिक एजेंट जोड़ से परे।

उत्पाद

Elon Musk ने घोषणा की कि Grok में अब स्किल्स फीचर है

xAI के Grok में अब स्किल्स फीचर शामिल है, संभवतः नए प्लग-इन या क्षमता मॉड्यूल की ओर इशारा है। पोस्ट को 57 लाख से अधिक बार देखा गया।

तकनीकी रिपोर्ट

Tongyi ने Qwen-Image-2.0 तकनीकी रिपोर्ट जारी की

Alibaba Tongyi Qianwen के इमेज मॉडल Qwen-Image-2.0 पर तकनीकी रिपोर्ट साझा की गई, जिसमें आर्किटेक्चर विवरण और प्रदर्शन डेटा शामिल हैं।

नया पेपर: सेल्फ-कंडीशन्ड एम्बेडिंग डिफ्यूजन मॉडल, ऑटोरिग्रेसिव टेक्स्ट जनरेशन को टक्कर

sedielem का पेपर सेल्फ-कंडीशन्ड एम्बेडिंग डिफ्यूजन पेश करता है, जो निरंतर एम्बेडिंग स्पेस में टेक्स्ट डिफ्यूजन मॉडलिंग है। यह ऑटोरिग्रेसिव जनरेशन गुणवत्ता से मेल खाता है और अनुमान में अधिक कुशल है, जो SED कार्य का आधुनिक उत्तराधिकारी है।

M3 Max उपयोगकर्ताओं ने DeepSeek V4 GGUF के माध्यम से स्थानीय AI अनुभव प्राप्त किया

antirez ने Hugging Face पर DeepSeek V4 के GGUF फ़ाइलें जारी कीं, जिससे M3 Max उपयोगकर्ता स्थानीय रूप से शक्तिशाली AI मॉडल चला सकते हैं। समुदाय ने मज़ाक में कहा कि M3 Max मालिकों को GTA 6 से पहले स्थानीय AGI मिल गया।

physics-intern एजेंट फ्रेमवर्क ने सैद्धांतिक भौतिकी मॉडल का प्रदर्शन बढ़ाया

डीप लर्निंग शोधकर्ताओं ने physics-intern एजेंट फ्रेमवर्क जारी किया, जिसने CritP बेंचमार्क पर Gemini 3.1 Pro की सटीकता 17.7% से बढ़ाकर 31.4% कर दी। यह दर्शाता है कि एजेंट फ्रेमवर्क कमजोर मॉडलों के प्रदर्शन को नाटकीय रूप से सुधार सकते हैं।

TMAS मल्टी-एजेंट सिनर्जी के माध्यम से टेस्ट-टाइम कंप्यूट को स्केल करता है

नया शोध TMAS मल्टी-एजेंट सहयोग का लाभ उठाकर टेस्ट-टाइम कंप्यूट को बढ़ाता है और तर्क क्षमताओं में सुधार करता है। यह दृष्टिकोण कई एजेंटों के बीच सिनर्जी के माध्यम से कंप्यूटेशनल स्केलिंग हासिल करता है।

गणितज्ञों द्वारा निर्मित Soohak बेंचमार्क LLM की शोध गणित क्षमता का मूल्यांकन करता है

गणितज्ञों द्वारा तैयार किया गया नया बेंचमार्क Soohak बड़े भाषा मॉडलों की शोध-स्तरीय गणितीय क्षमता का आकलन करता है। यह LLM की उच्च-स्तरीय गणितीय तर्क क्षमता के मूल्यांकन के लिए एक कठोर मानक प्रदान करता है।

Hugging Face इंफ्रास्ट्रक्चर के पैमाने ने CEO को चौंकाया, माइग्रेशन पर जोर

Clement Delangue ने HF इंफ्रास्ट्रक्चर के आकार पर आश्चर्य व्यक्त किया और सुझाव दिया कि अभी भी S3 या R2 पर मॉडल और डेटासेट होस्ट करने वाले उपयोगकर्ता बेहतर प्रदर्शन और सुरक्षा के लिए HF पर माइग्रेट करें।

त्वरित समाचार13.05

टूल्स

Cursor ने Claude Opus 4.7 फ़ास्ट मोड को एकीकृत किया

2.5x गति, पर अधिकांश कार्यों के लिए मानक गति की सिफारिश।

प्लेटफ़ॉर्म

v0 प्लेटफ़ॉर्म पर अब Claude Opus 4.7 फ़ास्ट मोड उपलब्ध

Vercel के v0 ने भी फ़ास्ट मोड समर्थन जोड़ा।

स्पीच AI

Sakana AI ने KAME रीयल-टाइम वॉयस कन्वर्सेशन आर्किटेक्चर जारी किया

तेज़ स्पीच मॉडल + बैकएंड बड़े मॉडल का कैस्केड।

मॉडल

Unsloth ने Qwen3.6-35B-A3B का क्वांटाइज्ड GGUF जारी किया

MTP-सक्षम, स्थानीय अनुमान के लिए अनुकूलित।

डेव टूल्स

Claude Code में मल्टीपल बैकग्राउंड एजेंट प्रबंधित करने के लिए एजेंट व्यू जोड़ा गया

टर्मिनल टैब में कई चालू एजेंटों का प्रबंधन संभव।

कानूनी AI

Anthropic ने 12 कानूनी प्लगइन्स के साथ Claude for Legal लॉन्च किया

20+ MCP कनेक्टर, M&A, गोपनीयता और कानूनी संचालन को कवर।

लीक

Google Veo 4 वीडियो जनरेशन जारी कर सकता है

संदर्भ वीडियो संपादन, Seedance 2.0 से थोड़ा बेहतर टेक्स्ट रेंडरिंग।

वीडियो AI

Vidu Q3 अपग्रेड: टर्बो मोड 5 गुना तेज़ वीडियो जनरेशन

उद्योग औसत से 5x तेज़, रचनाकारों के लिए मुफ्त परीक्षण कोड।

Ethan Mollick ने ChatGPT के स्टडी मोड को चुपचाप हटाने की आलोचना की

Mollick ने ट्वीट किया कि ChatGPT के स्टडी मोड को हटाना एक गलती है, क्योंकि सहायक मोड सीखने को नुकसान पहुँचा सकते हैं — वे सीधे उत्तर देकर छात्रों को यह भ्रम देते हैं कि उन्होंने सीख लिया है। Claude और Gemini में अभी भी समान सुविधाएँ हैं।

Mollick: ASI में विश्वास करने वाली AI लैब्स तैनाती इंजीनियरिंग टीमों को भंग कर देंगी

Ethan Mollick ने टिप्पणी की कि नौकरियाँ तब तक सुरक्षित हैं जब तक मानव एकीकरण और परिवर्तन प्रबंधन की आवश्यकता है। सच्चा ASI विश्वास फॉरवर्ड डिप्लॉयमेंट टीमों को खत्म करने का मतलब होगा — जो अभी तक नहीं हुआ है।

Jensen Huang का CMU दीक्षांत भाषण: बुद्धिमत्ता से AI भविष्य का नेतृत्व करें

NVIDIA CEO Jensen Huang ने Carnegie Mellon University के 2026 स्नातकों से कहा कि AI से डरें नहीं, बल्कि समझदारी से इसका मार्गदर्शन करें। उन्होंने आशावाद, जिम्मेदारी और महत्वाकांक्षा का आह्वान किया।

NVIDIA Earth-2 कोलोराडो विश्वविद्यालय को ओलों की चेतावनी का समय बढ़ाने में मदद करता है

Colorado State University ने NVIDIA Earth-2 और PhysicsNeMo का उपयोग करके ओलों की भविष्यवाणी की अग्रिम अवधि को मिनटों से घंटों तक बढ़ाया है। जनरेटिव AI और उच्च-रिज़ॉल्यूशन रडार डेटा का संयोजन वास्तविक समय में स्केलेबल भविष्यवाणी प्रदान करता है।

पेपर 'Rebellious Student' ने उल्टे शिक्षक संकेतों के साथ सेल्फ-डिस्टिलेशन RLVR का प्रस्ताव रखा

एक नया पेपर सेल्फ-डिस्टिलेशन सुदृढीकरण सीखने की विधि प्रस्तुत करता है जो शिक्षक संकेतों को उलटकर तर्क का अन्वेषण करता है — एक अभिनव दृष्टिकोण जो मॉडल को 'विद्रोही' बनने के लिए प्रोत्साहित करता है।

Pixal3D: पिक्सेल-अलाइन्ड 3D जनरेशन विधि

SIGGRAPH 2026 के लिए प्रस्तुत Pixal3D छवियों से उच्च-निष्ठा 3D संपत्ति उत्पन्न करने की पिक्सेल-अलाइन्ड विधि है। यह AI-संचालित 3D जनरेशन में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है।

संक्षिप्त सूचना13.05

विज्ञापन AI