2026 مايو 5 · الثلاثاء

Runway تطلق وكيل فيديو فوري: فيديو محادثة عالي الدقة بمعدل 24 إطارًا في الثانية من صورة واحدة

تقدم Runway شخصيات Runway Characters التي تحول الصورة الواحدة إلى وكيل فيديو تفاعلي كامل التعبيرات، يُبث مباشرة بدقة عالية مع زمن انتقال لا يتجاوز 1.75 ثانية بين الطرفين.

شخصيات Runway Characters — تحويل صورة واحدة إلى وكيل فيديو تفاعلي مباشر بتعابير وجهية كاملة

وكلاء الفيديو الفوري أصبحوا واقعًا. أعلنت Runway عن إطلاق نظام Runway Characters، وهو إنجاز تقني يحول الصورة الواحدة إلى وكيل فيديو نابض بالحياة قادر على إجراء محادثة كاملة مع تعابير وجهية طبيعية وصوت متزامن. يعمل النظام بمعدل 24 إطارًا في الثانية بدقة Full HD، مع زمن انتقال منخفض للغاية يبلغ 1.75 ثانية فقط بين المدخلات والمخرجات، مما يجعله أقرب ما يكون إلى التفاعل البشري المباشر. تجمع التقنية بين نماذج الرؤية الحاسوبية المتقدمة وتوليد الحركة من الصورة المرجعية، مما يفتح آفاقًا واسعة في خدمة العملاء الآلية والتعليم عن بُعد والترفيه التفاعلي والتسويق الرقمي.

منتج

xAI تطلق ميزة استنساخ الصوت في Grok Voice API

تطلق xAI ميزة استنساخ الصوت في Grok Voice API، والتي تدعم استنساخ صوت بعواطف طبيعية من تسجيلات قصيرة وإدارة مكتبات الصوت عبر وحدة التحكم لتخصيص صوت العلامة التجارية.

صوتان. أحدهما بشري والآخر ذكاء اصطناعي. استنساخ الصوت بالعواطف الطبيعية متاح الآن على Grok Voice API.

صوتان. أحدهما بشري والآخر ذكاء اصطناعي. هل يمكنك تخمين النسخة المولدة بالذكاء الاصطناعي؟ أصبح استنساخ الصوت الغني بالعواطف الطبيعية متاحًا الآن على واجهة Grok Voice API. يمكن للمستخدمين استنساخ الأصوات من تسجيلات قصيرة وإدارة مكتبات الصوت عبر وحدة تحكم xAI، مما يفتح آفاقًا جديدة لتجارب صوتية مخصصة للعلامات التجارية والمطورين.

منتج

Ollama يدعم Claude Desktop ويفتح الباب أمام الاستدلال من طرف ثالث

يدعم Ollama الآن جميع نماذج Ollama Cloud، بما في ذلك Claude Cowork و Claude Code، عبر ميزة الاستدلال المدمجة من طرف ثالث في Claude Desktop.

جميع نماذج Ollama Cloud أصبحت متاحة الآن عبر Claude Cowork و Claude Code من تطبيق Claude Desktop.

أصبح Ollama الآن متوافقًا مع Claude Desktop عبر ميزة الاستدلال المدمجة من طرف ثالث. يتيح هذا التكامل استخدام جميع النماذج من Ollama Cloud عبر أدوات Claude Cowork و Claude Code مباشرة من تطبيق سطح المكتب. هذا يربط بين النماذج مفتوحة المصدر ذاتية الاستضافة وأدوات البرمجة المتطورة، مما يمنح المطورين مسارًا سلسًا للاستفادة من النماذج المحلية ضمن نظام Anthropic البيئي.

نحتاج إلى ابتكار مصطلح جديد للهجمات التي تشنها بعض المعامل الصينية على واجهات API، يختلف عن التقطير، وإلا فإننا نخاطر بتشويه تقنية حاسمة تُعد أساسية لانتشار الذكاء الاصطناعي والبحث الأكاديمي والنظام البيئي مفتوح المصدر.

Nathan Lambert، interconnects.ai
مفتوح المصدر

Vercel تطلق deepsec: منسق وكلاء مفتوح المصدر لمراجعة أمنية عميقة

الرئيس التنفيذي لشركة Vercel يعلن عن إطلاق deepsec، منسق وكلاء مفتوح المصدر مصمم لمراجعة أمنية عميقة، وتم التحقق من فعاليته في العديد من مشاريع المصدر المفتوح الكبرى. يمكن لوكلاء البرمجة الآن اكتشاف الثغرات الحرجة بشكل آلي.

تقدم Vercel أداة deepsec، وهو منسق وكلاء مفتوح المصدر مصمم خصيصًا لمراجعات الأمان العميقة. تم تطوير الأداة للاستخدام الداخلي في البداية، وتم التحقق من فعاليتها عبر اختبارها على العديد من المشاريع مفتوحة المصدر الكبرى، مما أكسب الفريق قناعة كافية لمشاركتها مع العالم. يمكن لوكلاء البرمجة المدعومين بـ deepsec فحص قواعد البرمجيات بشكل آلي بحثًا عن الثغرات الحرجة وسوء التكوين ومخاطر سلسلة التوريد. ينسق المنظم عدة وكلاء متخصصين، يركز كل منهم على سطح هجوم مختلف، ويجمع نتائجهم في تقارير قابلة للتنفيذ. يمثل هذا تحولاً نحو التدقيق الأمني الآلي الاستباقي في دورة حياة تطوير البرمجيات.

Perplexity Computer أصبح متاحًا الآن داخل مساحة عمل Microsoft Teams.
منتج

Perplexity Computer يتكامل مع Microsoft Teams

أصبح Perplexity Computer متاحًا الآن داخل Microsoft Teams، مما يسمح للمستخدمين بإجراء البحوث والتحليلات وإنشاء المستندات مباشرة في مساحة عمل Teams بنفس قدرات منتج Computer المستقل.

وكلاء Luma يحولون المفاهيم الإبداعية إلى أنظمة إعلانية كاملة بشكل تلقائي.
منتج

Luma تطلق وكيلًا إبداعيًا يحول الأفكار إلى أنظمة إعلانية كاملة

يقوم وكلاء Luma بأتمتة العملية الكاملة من التخطيط والتوليد إلى التحسين التكراري، محولين الأفكار الإبداعية إلى أنظمة إعلانية متكاملة. يحدد المستخدمون المفهوم والاتجاه الجمالي، ويتولى الوكيل الباقي.

عتاد

تسريب أداء GB300 Ultra NVL72: أسرع بـ 2.7 مرة من GB200 في الاستدلال

تقرير SemiAnalysis أن شريحة GB300 Ultra NVL72 تحقق أداءً أسرع بمقدار 2.7 مرة من GB200 NVL72 في معايير الاستدلال القياسية الصناعية، مما يمثل قفزة جيلية كبيرة في أداء عتاد تدريب واستدلال الذكاء الاصطناعي.

بحث

DeepSeek-V4: الانتباه المختلط يقلل ذاكرة KV بنسبة 90% ويدعم سياق مليون رمز

يستخدم DeepSeek-V4 بنية انتباه مختلط ونموذج MoE متناثر، مما يقلل ذاكرة التخزين المؤقت KV بنسبة تصل إلى 90%، مما يتيح دعم أطوال سياق تصل إلى مليون رمز مع الحفاظ على كفاءة الاستدلال.

صناعة

NVIDIA: الذكاء الاصطناعي كعكة من خمس طبقات — الطاقة والرقاقات والبنية التحتية والنماذج والتطبيقات

تؤطر NVIDIA البنية التحتية للذكاء الاصطناعي كخمس طبقات مترابطة: الطاقة والرقاقات والبنية التحتية والنماذج والتطبيقات. الدول والشركات التي تبني المكدس الكامل هي التي ستحدد ملامح العصر الصناعي القادم.

إصدار نموذج

إصدار نموذج IBM Granite 4.1-8B محسّن لأجهزة 8 إلى 16 جيجابايت VRAM

نموذج IBM Granite 4.1-8B أصبح متاحًا الآن كمصدر مفتوح على Hugging Face، محسّن خصيصًا للأجهزة بذاكرة فيديو بين 8 و16 جيجابايت، مما يدفع حدود الذكاء الاصطناعي مفتوح المصدر المتاح للمطورين.

ابتكارات الوكلاء والنماذج 05.05

المؤسس المشارك لـ Anthropic جاك كلارك يقول إن هناك احتمالًا بنسبة 60% لتحقيق RSI بحلول نهاية عام 2028.

نقلاً عن goodside@
أخبار قصيرة ومجتمع 05.05