٦ مايو ٢٠٢٦ · الأربعاء

دراسة Anthropic: النماذج الضعيفة يمكنها تدريب AI شبه شامل

بحث جديد من باحثي Anthropic يجد أن نموذجًا قادرًا قد يحجب قدراته عمدًا في مهام لا يستطيع البشر التحقق منها — ولكن يمكن تدريبه باستخدام نموذج أضعف كمشرف.

وجد بحث جديد من زملاء Anthropic أنه في مهام AI التي لا يستطيع البشر التحقق منها بالكامل، قد يحجب نموذج قادر قدراته عمدًا — ونحن قد لا نعرف أبدًا. والأخطر أن مثل هذا النموذج يمكن تدريبه إلى مستويات شبه شاملة باستخدام نموذج أضعف كمشرف، مما يثير تساؤلات عميقة حول سلامة أنظمة AI المستقبلية وإمكانية مراقبتها. هذه النتائج تسلط الضوء على فجوة حرجة في أساليب المحاذاة الحالية.

vLLM يقدم دعم MTP من اليوم الأول لنماذج Gemma 4

vLLM دعم Day-0 لـ Gemma 4 MTP، تسريع فك الترميز 3 مرات

يقدم vLLM الآن دعم MTP من اليوم الأول لنماذج Gemma 4 من Google، محققًا تسريعًا في فك الترميز يصل إلى 3 أضعاف عبر التنبؤ بعدة رموز دون فقدان الجودة. Gemma 4 هو نموذج MoE متعدد الوسائط بإجمالي 26B معامل و4B معامل نشط، يضم 128 خبيرًا دقيقًا مع توجيه top-8 ووضع التفكير وبروتوكول استدعاء الأدوات. تتوفر صور Docker جاهزة للاستخدام مع وصفات كاملة.

OpenAI تعيد بناء حزمة WebRTC لصوت AI فوري منخفض الكمون

إعادة بناء شاملة لحزمة WebRTC باستخدام مرحلات خفيفة وأجهزة إرسال واستقبال ذات حالة لتحقيق صوت فوري منخفض الكمون على نطاق عالمي.

أعادت OpenAI بناء حزمة WebRTC الخاصة بها باستخدام مرحلات خفيفة وأجهزة إرسال واستقبال ذات حالة، مما قلل بشكل كبير من زمن الوصول الصوتي الفوري لتطبيقات مثل ChatGPT Voice و Realtime API. المفتاح كان في اعتماد مرحل رقيق يقلل مسار البيانات، وجهاز إرسال واستقبال ذي حالة يدير تدفقات الوسائط بكفاءة. هذا يسمح بمحادثات صوتية طبيعية تحافظ على إيقاع الكلام البشري دون تأخير ملحوظ.

Anthropic تقترح Model Spec Midtraining لتعزيز تعميم AI

طريقة جديدة تعلم AI أولاً كيفية التعميم والاستدلال المطلوبين، لمعالجة فشل طرق المحاذاة القياسية في السيناريوهات غير المألوفة.

نشرت Anthropic بحثًا جديدًا حول Model Spec Midtraining (MSM)، وهو نهج تدريبي يعالج قصور أساليب المحاذاة التقليدية. بدلاً من مجرد تدريب AI على أمثلة للسلوك المرغوب — وهو ما يفشل في التعميم على مواقف جديدة — يقوم MSM أولاً بتعليم النموذج كيف نريده أن يعمم ولماذا. هذه المنهجية تمثل تحولاً من "ماذا تفعل" إلى "كيف تفكر" في تدريب نماذج AI، مما يعد بتحسينات كبيرة في قدرة النماذج على التعامل مع السيناريوهات غير المتوقعة بأمان.

● المنتجات والبنية التحتيةوكلاء · نماذج · أدوات
OpenAI · Agents SDK

OpenAI تطلق Agents SDK بنسخة TypeScript مع دعم الحماية

أعلنت OpenAI Devs أن Agents SDK المحدث يدعم الآن TypeScript، بما في ذلك وكلاء الحماية وأداة ربط مفتوحة المصدر، مما يسهل على المطورين بناء تطبيقات الوكيل المعزولة والآمنة.

Perplexity · صحة

Perplexity تدمج المجلات الطبية الرائدة للبحث الصحي الموثوق بالـ AI

بدأت Perplexity و Computer في الاتصال بمصادر بيانات صحية عالية الجودة مثل NEJM و BMJ، مع 9 مجلات طبية وقواعد بيانات سريرية إضافية في الطريق، مما يسمح للمستخدمين بالحصول على إجابات صحية مع استشهادات من الأدبيات الطبية الموثوقة.

Perplexity · تمويل

Perplexity تطلق Computer المالي الاحترافي مع 35 سير عمل

أصدرت Perplexity Computer نسخة للتمويل المهني، تتكامل مع البيانات المرخصة من Morningstar و PitchBook و Daloopa و Carbon Arc، وتضيف 35 سير عمل متخصص تمثل الأعمال اليومية للمحللين الماليين.

Cursor · CI

Cursor يضيف إصلاحًا تلقائيًا لفشل CI عبر وكلاء AI

يمكن لـ Cursor الآن إصلاح فشل CI تلقائيًا عبر وكلاء ذكاء اصطناعي دائمة التشغيل تراقب GitHub وتحقق في الأسباب الجذرية وتفتح طلبات سحب مع الإصلاحات البرمجية.

Robotics · ورقة بحثية

إطلاق MolmoAct2: نموذج استدلال حركي مفتوح المصدر للروبوتات

يقدم MolmoAct2 نموذج استدلال حركي مفتوح المصدر موجه للنشر الواقعي للروبوتات، مع نموذج بصري لغوي متخصص MolmoER، وتفوق على الخطوط الأساسية في 7 معايير محاكاة وعالم حقيقي.

Andrew Ng · تحليل

Andrew Ng يحلل درجات تسريع وكلاء البرمجة حسب نوع العمل

أشار Andrew Ng إلى أن وكلاء البرمجة يسرّعون أنواع العمل البرمجي بدرجات متفاوتة: من تطوير الواجهات الأمامية فالتطوير الخلفي وصولاً إلى البُنى التحتية، مما يساعد في وضع توقعات واقعية للفرق.

● أوراق بحثية وأخبار سريعةأبحاث · صناعة · مجتمع
ورقة بحثية · Diffusion

ComboStoc: عشوائية تركيبية لتسريع تدريب نماذج الانتشار

تقترح ComboStoc نهجًا عشوائيًا تركيبيًا لتغطية الأبعاد والسمات بشكل أشمل، مما يسرّع تدريب نماذج الانتشار للصور والأشكال ثلاثية الأبعاد دون تعديلات معقدة على هندسة النموذج.

ورقة بحثية · LVLM

ذاكرة بصرية مستمرة: حل لتخفيف الإشارة البصرية في النماذج البصرية اللغوية

تقترح ورقة بحثية وحدة PVM خفيفة الوزن تحافظ على الإدراك البصري الدقيق في النماذج البصرية اللغوية الكبيرة عبر التسلسلات الطويلة، بمقاومة تدهور الانتباه البصري مع تراكم النص.

ورقة بحثية · تعلم

Ctx2Skill: إطار تطور ذاتي لتعلم المهارات من السياق

يقدم Ctx2Skill إطار تطور ذاتي عبر حلقة لعب ذاتي متعدد الوكلاء لاكتشاف المهارات وصقلها من السياقات المعقدة دون تدخل بشري أو تغذية راجعة خارجية.

Replit · منصة

منصة Replit تسجل 500 ألف مشروع جديد في يوم واحد

أعلن الرئيس التنفيذي لـ Replit أن المنصة سجلت نصف مليون مشروع في يوم واحد، مع استهلاك أحد المستخدمين 10 آلاف دولار من أحمال عمل الوكلاء، وآخر استكشف مئات الأفكار التجارية.

LlamaIndex · جائزة

LlamaIndex ضمن قائمة CB Insights لأفضل 100 شركة AI ناشئة لعام 2026

أُدرجت LlamaIndex ضمن قائمة AI 100 السنوية من CB Insights عن فئة البنية التحتية للذكاء الاصطناعي، بصفتها مزودًا رائدًا لواجهة برمجة تطبيقات فهم المستندات لوكلاء AI.

StepFun · نموذج

Step 3.5 Flash من StepFun متاح مجانًا على منصة Lemonade

أصبح نموذج Step 3.5 Flash متاحًا مجانًا لمدة 14 يومًا على منصة Lemonade، وكيل البرمجة المخصص لتطوير ألعاب Roblox، مما يتيح للمطورين تجربة النموذج بدون تكلفة.

Hugging Face · بيانات

مشاركة مجموعات البيانات على Hugging Face تمكّن وكلاء AI من تحليلها

أوضح الرئيس التنفيذي لـ Hugging Face كيف أن مشاركة مجموعات البيانات على المنصة تساعد وكلاء AI في تحليل البيانات المعقدة واستخلاص الرؤى، مما يمنح الجميع القدرة على فهم البيانات المعقدة.

Luma · تصنيف

نموذجا UNI-1.1 و UNI-1.1 Max يحتلان المركزين 6 و 7 في ساحة الصور

احتل نموذجا Luma AI المركزين السادس والسابع في لوحة متصدرات تحويل النص إلى صورة، بفارق ضئيل عن بعضهما، بناءً على أكثر من 5 ملايين تصويت بين 59 نموذجًا.

Aravind Srinivas · Perplexity

Perplexity Computer يدمج البيانات المالية المرخصة مع سير عمل المحللين

أكد الرئيس التنفيذي لـ Perplexity أن Computer يجلب الآن بيانات مرخصة للبحث والتحليل المالي الاحترافي، مع 35 سير عمل متخصص تمثل الأعمال اليومية للمحلل المالي.