Claude Managed Agents يضيف تنسيقًا متعدد الوكلاء وقدرات التعلم الذاتي
أطلقت Anthropic ميزات جديدة في Claude Managed Agents تشمل التنسيق متعدد الوكلاء وحلقات التحسين الذاتي القائمة على القواعد والتعلم الذاتي وخطافات الويب. هذه التحديثات تتيح للوكلاء التعاون فيما بينهم وتحسين أدائهم تلقائياً دون تدخل بشري.
Anthropic يرفع حدود Claude Code ومعدلات API بشكل كبير
ضاعفت Anthropic حد الـ 5 ساعات لـ Claude Code لمستخدمي Pro وMax وTeam، وألغت تحديد السرعة في ساعات الذروة، ورفعت بشكل كبير حدود معدل API لنموذج Opus. التغييرات دخلت حيز التنفيذ فوراً.
Perplexity تطور محرك الاستدلال الخاص بها ROSE
طورت Perplexity محرك الاستدلال الخاص بها ROSE الذي يخدم النماذج من التضمينات إلى نماذج اللغة الكبيرة ذات تريليونات المعلمات، ودمجت CuTeDSL لتسريع بناء نوى GPU المتخصصة.
إن التعاون غير المسبوق بين مختبرات الذكاء الاصطناعي الرائدة في مجال البنية التحتية للحوسبة يمثل تحولاً جوهرياً في المشهد التنافسي — فبدلاً من بناء الجدران، بدأنا نرى جسوراً من الحوسبة المشتركة.
— تحليل: حقبة جديدة من التعاون التنافسي في البنية التحتية للذكاء الاصطناعي
Google DeepMind تتعاون مع EVE Online لاستكشاف آفاق جديدة في أبحاث الذكاء الاصطناعي
أعلنت Google DeepMind عن شراكة مع مطور EVE Online لاستخدام عالمها المعقد الذي يقوده اللاعبون كصندوق رمل آمن لاختبار قدرات الذاكرة والتعلم المستمر والتخطيط طويل المدى لوكلاء الذكاء الاصطناعي.
Nvidia وServiceNow يسلمان وكلاء ذكاء اصطناعي مستقلين للمؤسسات
تعاونت Nvidia مع ServiceNow لتسليم وكلاء ذكاء اصطناعي يمكنهم التصرف بشكل مستقل في سير عمل المؤسسات، مع قدرات الحوكمة والتدقيق وتنفيذ الأمان. ServiceNow كشفت أيضاً عن Project Arc، وهو وكيل مكتبي طويل التشغيل.
Hugging Face تطلق متجر تطبيقات روبوتات مفتوح المصدر يضم أكثر من 200 تطبيق
أطلقت Hugging Face متجر تطبيقات مفتوح المصدر للروبوت Reachy Mini، يضم أكثر من 200 تطبيق بهدف خفض حاجز الدخول إلى تطوير الروبوتات وجعلها في متناول الجميع.
Luma تطلق واجهة Uni-1.1 API التي تستنتج عبر الإيجازات بدلاً من الرموز
أطلقت Luma واجهة برمجة تطبيقات Uni-1.1 التي تستنتج من خلال فهم الإيجازات بدلاً من معالجة الرموز، وتنتج نتائج بجودة سينمائية في الموضة والهندسة المعمارية والقصص المصورة.
OpenAI تفتح مصدر بروتوكول MRC المستخدم في تدريب ChatGPT
قامت OpenAI بالتعاون مع AMD وBroadcom وIntel وMicrosoft وNvidia بفتح مصدر بروتوكول الشبكة MRC المستخدم في تدريب ChatGPT، بهدف تحسين كفاءة تدريب الذكاء الاصطناعي على نطاق واسع.
OpenAI تحدث GPT-5.5 Instant كأحدث نموذج افتراضي لـ ChatGPT
OpenAI حدثت نموذج GPT-5.5 Instant ليصبح النموذج الافتراضي في ChatGPT، مع تحسينات ملحوظة في معالجة الصور والمستندات وتقليل كبير في معدلات الهلوسة عبر المجالات المتخصصة كالقانون والمال والطب.
Zyphra تطلق ZAYA1-8B بنموذج MoE للاستدلال
Zyphra أطلقت نموذج ZAYA1-8B للاستدلال بتقنية MoE وبنية DSMoE-MLA++ المتطورة، معززاً بتقنيات RL متقدمة واختبار التوسع الزمني، متقدماً على نماذج أكبر بكثير.
Anthropic تكشف في Code w/ Claude: نمو API بـ 17 ضعفاً وشراكة مع SpaceX
في فعالية Code w/ Claude، كشفت Anthropic عن نمو حركة API بنسبة 17 ضعفاً سنوياً، وأعلنت شراكة حوسبة مع SpaceX، وأطلقت ميزات التنسيق متعدد الوكلاء وDreaming للتحسين الذاتي.
Cursor يستخدم إصدارات Composer السابقة لبناء بيئات RL تلقائياً
نظام التثبيت التلقائي في Cursor يستخدم نماذج Composer السابقة لإعداد بيئات تطوير معززة بالتعلم، لتركز النماذج الجديدة على حل المشكلات الأصعب.
Perplexity تضيف البحث المالي إلى Agent API
تتيح الميزة الجديدة للمطورين استدعاء بيانات السوق المرخصة في الوقت الفعلي عبر استدعاء أداة واحد للوكلاء.
Cursor 3.3 يضيف تحليلاً مرئياً لاستخدام السياق
يمكن للمطورين الآن رؤية تفصيل لاستخدام السياق للوكلاء، لتشخيص المشكلات وتحسين الإعدادات عبر القواعد والمهارات والوكلاء الفرعيين.
مدير هندسة Anthropic: معظم عملي عبر الهاتف بمئات الوكلاء
Boris Cherny يكشف أن Claude App يضم 5 إلى 10 جلسات دائمة ومئات الوكلاء، مع آلاف المهام العميقة تعمل ليلاً عبر آلية Loop وجدولة cron.
شراكة xAI وAnthropic: هل يتراجع Grok عن الريادة؟
يرى محللون أن فتح xAI لحاسوب Colossus أمام منافستها Anthropic يشير إلى أن نموذج Grok قد لا يحافظ على موقعه كنموذج رائد في المستقبل.
OBLIQ-Bench: أضخم معيار لاسترجاع المعلومات حتى الآن
أطلقت الباحثة Diane معيار OBLIQ-Bench الذي يُعد الأكثر طموحاً في مجال استرجاع المعلومات، مصمماً لدفع حدود تقنيات البحث الحالية واختبار قدرات النماذج.
مايكروسوفت تطلق Gaia2: معيار ديناميكي لتقييم وكلاء LLM
Gaia2 من Microsoft Research يختبر الوكلاء في بيئات غير متزامنة مع ضوضاء وقيود زمنية وأحداث متطورة، مع نتائج أولية تُظهر تفوق GPT-5.
نموذج LightOn بـ 0.1B معلمة يتفوق على نماذج أكبر بكثير
نموذج LightOn للتفاعل المتأخر بـ 100 مليون معلمة فقط تفوق على نماذج كثيفة أكبر بعدة مراتب في مهمة OBLIQ-Bench، مع هامش تحسين كبير يصل إلى 91%.
روبوت robobun من Bun يتجاوز مساهمات المؤسس على GitHub
في Code w/ Code، كشف فريق Bun أن روبوت GitHub الخاص بهم robobun أصبح يساهم في المشروع بعدد contributions يفوق ما قدمه المؤسس Jarred Sumner شخصياً.
Luma تطلق وكلاء إبداعيين لتوليد الإعلانات المستهدفة آلياً
يمكن للمستخدمين تحديد الجمهور وضبط التباين، ويقوم وكلاء Luma بتوليد كل نسخة من الإعلان الموجه تلقائياً، مغطياً مراحل التخطيط والتوليد والتكرار والتحسين.
تقييمات متعددة: DeepSeek V4-Pro وV4-Flash متطابقان تقريباً
في عدة اختبارات، أظهرت نماذج DeepSeek V4-Pro وV4-Flash أداءً متطابقاً تقريباً، بينما سجلت MiMo 2.5 Pro وGLM 5.1 وGPT-5.5 نتائج متفوقة.
MiMo 2.5 Pro وGLM 5.1 يتفوقان على DeepSeek وKimi
نتائج مبهرة من MiMo 2.5 Pro وGLM 5.1 في أحدث اختبارات المقارنة، متجاوزين DeepSeek وKimi بأداء لافت يعيد رسم خريطة النماذج المفتوحة المصدر.
vLLM يتكامل مع Mooncake لتخزين KV الموزع
مدونة vLLM تكشف عن تكامل مع Mooncake Store لحل مشكلة إخلاء ذاكرة KV المحلية في سياقات الوكلاء الطويلة التي تصل لأكثر من 80 ألف رمز، مع تحسين إعادة استخدام البادئات بنسبة 94%.
vLLM شريك إطلاق حصري لمكتبة Tokenspeed من LightSeek
vLLM يدمج مكتبة MLA من LightSeek المحسّنة خصيصاً لأحمال العمل الوكيلية ذات السياقات الطويلة والمتعددة الأدوار، والمصممة لنماذج Kimi 2.5/2.6 وDeepSeek R1.