2026 مايو 5 · الثلاثاء

Runway تطلق وكيل فيديو فوري: فيديو محادثة عالي الدقة بمعدل 24 إطارًا في الثانية من صورة واحدة

تقدم Runway شخصيات Runway Characters التي تحول الصورة الواحدة إلى وكيل فيديو تفاعلي كامل التعبيرات، يُبث مباشرة بدقة عالية مع زمن انتقال لا يتجاوز 1.75 ثانية بين الطرفين.

شخصيات Runway Characters — تحويل صورة واحدة إلى وكيل فيديو تفاعلي مباشر بتعابير وجهية كاملة

وكلاء الفيديو الفوري أصبحوا واقعًا. أعلنت Runway عن إطلاق نظام Runway Characters، وهو إنجاز تقني يحول الصورة الواحدة إلى وكيل فيديو نابض بالحياة قادر على إجراء محادثة كاملة مع تعابير وجهية طبيعية وصوت متزامن. يعمل النظام بمعدل 24 إطارًا في الثانية بدقة Full HD، مع زمن انتقال منخفض للغاية يبلغ 1.75 ثانية فقط بين المدخلات والمخرجات، مما يجعله أقرب ما يكون إلى التفاعل البشري المباشر. تجمع التقنية بين نماذج الرؤية الحاسوبية المتقدمة وتوليد الحركة من الصورة المرجعية، مما يفتح آفاقًا واسعة في خدمة العملاء الآلية والتعليم عن بُعد والترفيه التفاعلي والتسويق الرقمي.

منتج

xAI تطلق ميزة استنساخ الصوت في Grok Voice API

تطلق xAI ميزة استنساخ الصوت في Grok Voice API، والتي تدعم استنساخ صوت بعواطف طبيعية من تسجيلات قصيرة وإدارة مكتبات الصوت عبر وحدة التحكم لتخصيص صوت العلامة التجارية.

صوتان. أحدهما بشري والآخر ذكاء اصطناعي. استنساخ الصوت بالعواطف الطبيعية متاح الآن على Grok Voice API.

صوتان. أحدهما بشري والآخر ذكاء اصطناعي. هل يمكنك تخمين النسخة المولدة بالذكاء الاصطناعي؟ أصبح استنساخ الصوت الغني بالعواطف الطبيعية متاحًا الآن على واجهة Grok Voice API. يمكن للمستخدمين استنساخ الأصوات من تسجيلات قصيرة وإدارة مكتبات الصوت عبر وحدة تحكم xAI، مما يفتح آفاقًا جديدة لتجارب صوتية مخصصة للعلامات التجارية والمطورين.

منتج

Ollama يدعم Claude Desktop ويفتح الباب أمام الاستدلال من طرف ثالث

يدعم Ollama الآن جميع نماذج Ollama Cloud، بما في ذلك Claude Cowork و Claude Code، عبر ميزة الاستدلال المدمجة من طرف ثالث في Claude Desktop.

جميع نماذج Ollama Cloud أصبحت متاحة الآن عبر Claude Cowork و Claude Code من تطبيق Claude Desktop.

أصبح Ollama الآن متوافقًا مع Claude Desktop عبر ميزة الاستدلال المدمجة من طرف ثالث. يتيح هذا التكامل استخدام جميع النماذج من Ollama Cloud عبر أدوات Claude Cowork و Claude Code مباشرة من تطبيق سطح المكتب. هذا يربط بين النماذج مفتوحة المصدر ذاتية الاستضافة وأدوات البرمجة المتطورة، مما يمنح المطورين مسارًا سلسًا للاستفادة من النماذج المحلية ضمن نظام Anthropic البيئي.

نحتاج إلى ابتكار مصطلح جديد للهجمات التي تشنها بعض المعامل الصينية على واجهات API، يختلف عن التقطير، وإلا فإننا نخاطر بتشويه تقنية حاسمة تُعد أساسية لانتشار الذكاء الاصطناعي والبحث الأكاديمي والنظام البيئي مفتوح المصدر.
Nathan Lambert، interconnects.ai

مفتوح المصدر

Vercel تطلق deepsec: منسق وكلاء مفتوح المصدر لمراجعة أمنية عميقة

الرئيس التنفيذي لشركة Vercel يعلن عن إطلاق deepsec، منسق وكلاء مفتوح المصدر مصمم لمراجعة أمنية عميقة، وتم التحقق من فعاليته في العديد من مشاريع المصدر المفتوح الكبرى. يمكن لوكلاء البرمجة الآن اكتشاف الثغرات الحرجة بشكل آلي.

تقدم Vercel أداة deepsec، وهو منسق وكلاء مفتوح المصدر مصمم خصيصًا لمراجعات الأمان العميقة. تم تطوير الأداة للاستخدام الداخلي في البداية، وتم التحقق من فعاليتها عبر اختبارها على العديد من المشاريع مفتوحة المصدر الكبرى، مما أكسب الفريق قناعة كافية لمشاركتها مع العالم. يمكن لوكلاء البرمجة المدعومين بـ deepsec فحص قواعد البرمجيات بشكل آلي بحثًا عن الثغرات الحرجة وسوء التكوين ومخاطر سلسلة التوريد. ينسق المنظم عدة وكلاء متخصصين، يركز كل منهم على سطح هجوم مختلف، ويجمع نتائجهم في تقارير قابلة للتنفيذ. يمثل هذا تحولاً نحو التدقيق الأمني الآلي الاستباقي في دورة حياة تطوير البرمجيات.

Perplexity Computer أصبح متاحًا الآن داخل مساحة عمل Microsoft Teams.

منتج

Perplexity Computer يتكامل مع Microsoft Teams

أصبح Perplexity Computer متاحًا الآن داخل Microsoft Teams، مما يسمح للمستخدمين بإجراء البحوث والتحليلات وإنشاء المستندات مباشرة في مساحة عمل Teams بنفس قدرات منتج Computer المستقل.

وكلاء Luma يحولون المفاهيم الإبداعية إلى أنظمة إعلانية كاملة بشكل تلقائي.

منتج

Luma تطلق وكيلًا إبداعيًا يحول الأفكار إلى أنظمة إعلانية كاملة

يقوم وكلاء Luma بأتمتة العملية الكاملة من التخطيط والتوليد إلى التحسين التكراري، محولين الأفكار الإبداعية إلى أنظمة إعلانية متكاملة. يحدد المستخدمون المفهوم والاتجاه الجمالي، ويتولى الوكيل الباقي.

عتاد

تسريب أداء GB300 Ultra NVL72: أسرع بـ 2.7 مرة من GB200 في الاستدلال

تقرير SemiAnalysis أن شريحة GB300 Ultra NVL72 تحقق أداءً أسرع بمقدار 2.7 مرة من GB200 NVL72 في معايير الاستدلال القياسية الصناعية، مما يمثل قفزة جيلية كبيرة في أداء عتاد تدريب واستدلال الذكاء الاصطناعي.

بحث

DeepSeek-V4: الانتباه المختلط يقلل ذاكرة KV بنسبة 90% ويدعم سياق مليون رمز

يستخدم DeepSeek-V4 بنية انتباه مختلط ونموذج MoE متناثر، مما يقلل ذاكرة التخزين المؤقت KV بنسبة تصل إلى 90%، مما يتيح دعم أطوال سياق تصل إلى مليون رمز مع الحفاظ على كفاءة الاستدلال.

صناعة

NVIDIA: الذكاء الاصطناعي كعكة من خمس طبقات — الطاقة والرقاقات والبنية التحتية والنماذج والتطبيقات

تؤطر NVIDIA البنية التحتية للذكاء الاصطناعي كخمس طبقات مترابطة: الطاقة والرقاقات والبنية التحتية والنماذج والتطبيقات. الدول والشركات التي تبني المكدس الكامل هي التي ستحدد ملامح العصر الصناعي القادم.

إصدار نموذج

إصدار نموذج IBM Granite 4.1-8B محسّن لأجهزة 8 إلى 16 جيجابايت VRAM

نموذج IBM Granite 4.1-8B أصبح متاحًا الآن كمصدر مفتوح على Hugging Face، محسّن خصيصًا للأجهزة بذاكرة فيديو بين 8 و16 جيجابايت، مما يدفع حدود الذكاء الاصطناعي مفتوح المصدر المتاح للمطورين.

ابتكارات الوكلاء والنماذج 05.05

نموذج

nanowhale: نموذج DeepSeek صغير مدرب بالكامل بواسطة وكيل ذكي

مستوحى من nanochat الخاص بـ Karpathy، nanowhale هو نموذج DeepSeek صغير تم تدريبه بالكامل بواسطة وكيل ذكاء اصطناعي، مما يعرض التدريب الآلي للنماذج كنموذج جديد. يوضح المشروع أن الوكلاء يمكنهم التعامل مع مسار التدريب المسبق الكامل بشكل مستقل.

أداة

XGrammar-2: التوليد المنظم لأطر الوكلاء المعقدة

يقدم XGrammar-2 تقنية التوليد المنظم لأطر الوكلاء المعقدة، مع دعم صيغ استدعاء الأدوات الصارمة وتكامل مدمج مع DeepSeek. يضمن تنسيق مخرجات موثوق لسيناريوهات تنسيق الوكلاء المتعددين.

منتج

Grok 4.3 يبني لعبة كاملة من موجه واحد

أظهر Grok 4.3 قدرة على بناء لعبة كاملة قابلة للتشغيل من موجه واحد، مع أسرع سرعة إخراج للرموز مقارنة بأي نموذج، متفوقًا على Claude Sonnet في سرعة التوليد الشاملة.

نشر

كتاب "التعلم العميق باستخدام Python" لـ François Chollet أصبح مجانيًا للقراءة عبر الإنترنت

الدليل المرجعي للتعلم العميق، الذي بيع منه 120 ألف نسخة وساعد عشرات الآلاف في بدء مسيرتهم المهنية، أصبح الآن متاحًا للقراءة المجانية عبر الإنترنت. يزيل الكتاب الغموض عن كيفية عمل التعلم العميق وكيفية تطبيقه بفعالية.

منتج

Replit: بناء عروض تقديمية كاملة بوصف ما تريد

يتيح Replit الآن للمستخدمين إنشاء عروض تقديمية كاملة دون لمس شريحة واحدة. صف فكرتك وكرر عبر الدردشة وحرر بصريًا ثم صدّر إلى PPTX أو Google Slides أو PDF، أو انشر كرابط مباشر.

ورقة بحثية

Web2BigTable: نظام وكلاء متعدد المستويات للبحث على نطاق الإنترنت

إطار عمل ثنائي المستوى متعدد الوكلاء للبحث على نطاق الإنترنت واستخراج الجداول. يحقق معدل نجاح 38.50 على معيار WideSearch، متفوقًا بشكل كبير على المركز الثاني الذي حقق 5.10 فقط.

نموذج

Qwen 3.6: سرعة معالجة عالية على ذاكرة 12 جيجابايت فقط

إعدادات Qwen 3.6 التي شاركها المجتمع توفر سرعة معالجة عالية حتى على بطاقات رسوميات استهلاكية بذاكرة 12 جيجابايت فقط.

عتاد

Blackwell Ultra: سُميت تيمنًا بالأداء الفائق

شريحة NVIDIA Blackwell Ultra تستمد اسمها من أدائها الفائق في معالجة الرسوميات، وفقًا لتأكيد SemiAnalysis.

توجهات

نماذج DeepSeek وشاومي وOpenAI تتصدر Hugging Face

تشمل النماذج مفتوحة المصدر الرائجة حاليًا على Hugging Face إصدارات من DeepSeek وشاومي وOpenAI و Mistral AI و AI Pool.

المؤسس المشارك لـ Anthropic جاك كلارك يقول إن هناك احتمالًا بنسبة 60% لتحقيق RSI بحلول نهاية عام 2028.
نقلاً عن goodside@

أخبار قصيرة ومجتمع 05.05

تعليم

منصة تعلم متعددة الوسائط بالذكاء الاصطناعي للطلاب الصم

الرئيس التنفيذي لـ Replit أمجد مسعد يسلط الضوء على منصة تعلم متعددة الوسائط مدعومة بالذكاء الاصطناعي مصممة خصيصًا للطلاب الصم.

أوراق بحثية

أفضل الأوراق: أنظمة الوكلاء العودية ونمذجة العالم

تسلط أوراق Hugging Face الضوء على أفضل أبحاث الأسبوع حول أنظمة الوكلاء متعددي المستويات العودية ونمذجة العالم بالوكلاء وهياكل تنظيم الذكاء الاصطناعي.

ورقة بحثية

UniVidX: إطار موحد متعدد الوسائط لتوليد الفيديو عبر انتشار النماذج الأولية

يقترح UniVidX إطارًا موحدًا متعدد الوسائط يستفيد من نماذج الانتشار الأولية، محققًا أداء متطور في مهام تركيب طبقات RGB و RGBA.

أداة

أداة تصور نماذج Hugging Face تتيح استكشاف أي بنية معمارية

أداة مجتمعية جديدة تصور بنى نماذج Hugging Face بأي مستوى من التفصيل بمجرد إدخال رابط النموذج، مع دعم استكشاف الطبقات والمقارنة بين النماذج.