xAI تطلق ميزة استنساخ الصوت في Grok Voice API
تطلق xAI ميزة استنساخ الصوت في Grok Voice API، والتي تدعم استنساخ صوت بعواطف طبيعية من تسجيلات قصيرة وإدارة مكتبات الصوت عبر وحدة التحكم لتخصيص صوت العلامة التجارية.
صوتان. أحدهما بشري والآخر ذكاء اصطناعي. هل يمكنك تخمين النسخة المولدة بالذكاء الاصطناعي؟ أصبح استنساخ الصوت الغني بالعواطف الطبيعية متاحًا الآن على واجهة Grok Voice API. يمكن للمستخدمين استنساخ الأصوات من تسجيلات قصيرة وإدارة مكتبات الصوت عبر وحدة تحكم xAI، مما يفتح آفاقًا جديدة لتجارب صوتية مخصصة للعلامات التجارية والمطورين.
Ollama يدعم Claude Desktop ويفتح الباب أمام الاستدلال من طرف ثالث
يدعم Ollama الآن جميع نماذج Ollama Cloud، بما في ذلك Claude Cowork و Claude Code، عبر ميزة الاستدلال المدمجة من طرف ثالث في Claude Desktop.
أصبح Ollama الآن متوافقًا مع Claude Desktop عبر ميزة الاستدلال المدمجة من طرف ثالث. يتيح هذا التكامل استخدام جميع النماذج من Ollama Cloud عبر أدوات Claude Cowork و Claude Code مباشرة من تطبيق سطح المكتب. هذا يربط بين النماذج مفتوحة المصدر ذاتية الاستضافة وأدوات البرمجة المتطورة، مما يمنح المطورين مسارًا سلسًا للاستفادة من النماذج المحلية ضمن نظام Anthropic البيئي.
نحتاج إلى ابتكار مصطلح جديد للهجمات التي تشنها بعض المعامل الصينية على واجهات API، يختلف عن التقطير، وإلا فإننا نخاطر بتشويه تقنية حاسمة تُعد أساسية لانتشار الذكاء الاصطناعي والبحث الأكاديمي والنظام البيئي مفتوح المصدر.
Nathan Lambert، interconnects.ai
Perplexity Computer يتكامل مع Microsoft Teams
أصبح Perplexity Computer متاحًا الآن داخل Microsoft Teams، مما يسمح للمستخدمين بإجراء البحوث والتحليلات وإنشاء المستندات مباشرة في مساحة عمل Teams بنفس قدرات منتج Computer المستقل.
Luma تطلق وكيلًا إبداعيًا يحول الأفكار إلى أنظمة إعلانية كاملة
يقوم وكلاء Luma بأتمتة العملية الكاملة من التخطيط والتوليد إلى التحسين التكراري، محولين الأفكار الإبداعية إلى أنظمة إعلانية متكاملة. يحدد المستخدمون المفهوم والاتجاه الجمالي، ويتولى الوكيل الباقي.
تسريب أداء GB300 Ultra NVL72: أسرع بـ 2.7 مرة من GB200 في الاستدلال
تقرير SemiAnalysis أن شريحة GB300 Ultra NVL72 تحقق أداءً أسرع بمقدار 2.7 مرة من GB200 NVL72 في معايير الاستدلال القياسية الصناعية، مما يمثل قفزة جيلية كبيرة في أداء عتاد تدريب واستدلال الذكاء الاصطناعي.
DeepSeek-V4: الانتباه المختلط يقلل ذاكرة KV بنسبة 90% ويدعم سياق مليون رمز
يستخدم DeepSeek-V4 بنية انتباه مختلط ونموذج MoE متناثر، مما يقلل ذاكرة التخزين المؤقت KV بنسبة تصل إلى 90%، مما يتيح دعم أطوال سياق تصل إلى مليون رمز مع الحفاظ على كفاءة الاستدلال.
NVIDIA: الذكاء الاصطناعي كعكة من خمس طبقات — الطاقة والرقاقات والبنية التحتية والنماذج والتطبيقات
تؤطر NVIDIA البنية التحتية للذكاء الاصطناعي كخمس طبقات مترابطة: الطاقة والرقاقات والبنية التحتية والنماذج والتطبيقات. الدول والشركات التي تبني المكدس الكامل هي التي ستحدد ملامح العصر الصناعي القادم.
إصدار نموذج IBM Granite 4.1-8B محسّن لأجهزة 8 إلى 16 جيجابايت VRAM
نموذج IBM Granite 4.1-8B أصبح متاحًا الآن كمصدر مفتوح على Hugging Face، محسّن خصيصًا للأجهزة بذاكرة فيديو بين 8 و16 جيجابايت، مما يدفع حدود الذكاء الاصطناعي مفتوح المصدر المتاح للمطورين.
nanowhale: نموذج DeepSeek صغير مدرب بالكامل بواسطة وكيل ذكي
مستوحى من nanochat الخاص بـ Karpathy، nanowhale هو نموذج DeepSeek صغير تم تدريبه بالكامل بواسطة وكيل ذكاء اصطناعي، مما يعرض التدريب الآلي للنماذج كنموذج جديد. يوضح المشروع أن الوكلاء يمكنهم التعامل مع مسار التدريب المسبق الكامل بشكل مستقل.
XGrammar-2: التوليد المنظم لأطر الوكلاء المعقدة
يقدم XGrammar-2 تقنية التوليد المنظم لأطر الوكلاء المعقدة، مع دعم صيغ استدعاء الأدوات الصارمة وتكامل مدمج مع DeepSeek. يضمن تنسيق مخرجات موثوق لسيناريوهات تنسيق الوكلاء المتعددين.
Grok 4.3 يبني لعبة كاملة من موجه واحد
أظهر Grok 4.3 قدرة على بناء لعبة كاملة قابلة للتشغيل من موجه واحد، مع أسرع سرعة إخراج للرموز مقارنة بأي نموذج، متفوقًا على Claude Sonnet في سرعة التوليد الشاملة.
كتاب "التعلم العميق باستخدام Python" لـ François Chollet أصبح مجانيًا للقراءة عبر الإنترنت
الدليل المرجعي للتعلم العميق، الذي بيع منه 120 ألف نسخة وساعد عشرات الآلاف في بدء مسيرتهم المهنية، أصبح الآن متاحًا للقراءة المجانية عبر الإنترنت. يزيل الكتاب الغموض عن كيفية عمل التعلم العميق وكيفية تطبيقه بفعالية.
Replit: بناء عروض تقديمية كاملة بوصف ما تريد
يتيح Replit الآن للمستخدمين إنشاء عروض تقديمية كاملة دون لمس شريحة واحدة. صف فكرتك وكرر عبر الدردشة وحرر بصريًا ثم صدّر إلى PPTX أو Google Slides أو PDF، أو انشر كرابط مباشر.
Web2BigTable: نظام وكلاء متعدد المستويات للبحث على نطاق الإنترنت
إطار عمل ثنائي المستوى متعدد الوكلاء للبحث على نطاق الإنترنت واستخراج الجداول. يحقق معدل نجاح 38.50 على معيار WideSearch، متفوقًا بشكل كبير على المركز الثاني الذي حقق 5.10 فقط.
Qwen 3.6: سرعة معالجة عالية على ذاكرة 12 جيجابايت فقط
إعدادات Qwen 3.6 التي شاركها المجتمع توفر سرعة معالجة عالية حتى على بطاقات رسوميات استهلاكية بذاكرة 12 جيجابايت فقط.
Blackwell Ultra: سُميت تيمنًا بالأداء الفائق
شريحة NVIDIA Blackwell Ultra تستمد اسمها من أدائها الفائق في معالجة الرسوميات، وفقًا لتأكيد SemiAnalysis.
نماذج DeepSeek وشاومي وOpenAI تتصدر Hugging Face
تشمل النماذج مفتوحة المصدر الرائجة حاليًا على Hugging Face إصدارات من DeepSeek وشاومي وOpenAI و Mistral AI و AI Pool.
المؤسس المشارك لـ Anthropic جاك كلارك يقول إن هناك احتمالًا بنسبة 60% لتحقيق RSI بحلول نهاية عام 2028.
نقلاً عن goodside@
منصة تعلم متعددة الوسائط بالذكاء الاصطناعي للطلاب الصم
الرئيس التنفيذي لـ Replit أمجد مسعد يسلط الضوء على منصة تعلم متعددة الوسائط مدعومة بالذكاء الاصطناعي مصممة خصيصًا للطلاب الصم.
أفضل الأوراق: أنظمة الوكلاء العودية ونمذجة العالم
تسلط أوراق Hugging Face الضوء على أفضل أبحاث الأسبوع حول أنظمة الوكلاء متعددي المستويات العودية ونمذجة العالم بالوكلاء وهياكل تنظيم الذكاء الاصطناعي.
UniVidX: إطار موحد متعدد الوسائط لتوليد الفيديو عبر انتشار النماذج الأولية
يقترح UniVidX إطارًا موحدًا متعدد الوسائط يستفيد من نماذج الانتشار الأولية، محققًا أداء متطور في مهام تركيب طبقات RGB و RGBA.
أداة تصور نماذج Hugging Face تتيح استكشاف أي بنية معمارية
أداة مجتمعية جديدة تصور بنى نماذج Hugging Face بأي مستوى من التفصيل بمجرد إدخال رابط النموذج، مع دعم استكشاف الطبقات والمقارنة بين النماذج.