في خطوة لافتة، أعلنت Meta عن إطلاق مجموعة جديدة من نماذج الذكاء الاصطناعي تحت اسم Llama 4، وذلك في عطلة نهاية الأسبوع، لتشكل نقلة نوعية في مجال النماذج مفتوحة المصدر.
3 نماذج جديدة ونموذج رابع قيد التدريب
السلسلة الجديدة تتضمن 3 نماذج رئيسية:
- Llama 4 Scout
- Llama 4 Maverick
- Llama 4 Behemoth (قيد التطوير)
جميع هذه النماذج تم تدريبها باستخدام كميات ضخمة من النصوص، الصور، والفيديوهات غير المصنفة، مما يمنحها فهمًا بصريًا متقدمًا ومتعدد الوسائط، حسب وصف ميتا.
السبب وراء التسريع: المنافسة الصينية
كشفت تقارير أن النجاح المتزايد لنماذج شركة DeepSeek AI الصينية، التي تفوقت على Llama السابقة، دفع ميتا لتسريع تطوير Llama 4. حيث شكّلت الشركة غرف طوارئ داخلية لفهم كيف نجحت DeepSeek في خفض تكلفة التدريب والتشغيل لنماذج مثل R1 وV3.
Scout وMaverick متاحان الآن مجانًا
- Scout وMaverick متاحان للتحميل عبر موقع Llama.com ومنصات الشركاء مثل Hugging Face.
- Behemoth لا يزال قيد التدريب، ومن المتوقع أن يكون أقوى نموذج في السلسلة.
تحديث Meta AI ليعمل بـ Llama 4
أعلنت ميتا أن مساعدها الذكي Meta AI، المستخدم في تطبيقات مثل واتساب وإنستغرام وماسنجر، تم تحديثه ليعمل بنموذج Llama 4 في 40 دولة، مع مميزات متعددة الوسائط متوفرة حاليًا في الولايات المتحدة فقط باللغة الإنجليزية.
قيود على الاستخدام في أوروبا
بسبب تشريعات الخصوصية والذكاء الاصطناعي الصارمة في الاتحاد الأوروبي، تمنع ميتا المستخدمين والشركات المقيمة في أوروبا من استخدام أو توزيع Llama 4. كما تتطلب الشركات التي تتجاوز 700 مليون مستخدم نشط شهريًا الحصول على ترخيص خاص من ميتا.
أول استخدام لبنية “الخبراء” MoE
لأول مرة، تعتمد Llama 4 على بنية “مزيج من الخبراء” (MoE)، وهي بنية تجعل النموذج أكثر كفاءة من حيث الأداء والتكلفة. حيث يتم تقسيم العمليات إلى أجزاء صغيرة يتم توزيعها على “خبراء” متخصصين.
على سبيل المثال:
- Maverick: يحتوي على 400 مليار مُعلَم، لكن 17 مليار منها فقط نشطة في وقت التنفيذ، موزعة على 128 خبير.
- Scout: لديه 109 مليار مُعلَم، مع 17 مليار منها نشطة و16 خبير.
أداء مذهل ينافس عمالقة الذكاء الاصطناعي
وفقًا لاختبارات ميتا الداخلية:
- Maverick يتفوق على نماذج شهيرة مثل GPT-4o وGemini 2.0 في مجالات البرمجة، الاستدلال، ودعم اللغات المتعددة.
- لكن لا يزال أداؤه أقل من Claude 3.7 Sonnet وGPT-4.5 وGemini 2.5 Pro في بعض الجوانب.
أما Scout فيتميز بـ:
- نافذة سياق ضخمة جدًا تصل إلى 10 ملايين “توكن”، مما يتيح له التعامل مع مستندات ضخمة ومعقدة.
- إمكانية التشغيل على GPU واحد فقط من نوع Nvidia H100.
Behemoth: العملاق القادم
- يتضمن ما يقارب 2 تريليون مُعلَم.
- يضم 288 مليار مُعلَم نشط موزعة على 16 خبير.
- يتطلب أجهزة قوية جدًا، وأظهر في الاختبارات الداخلية أداءً يفوق GPT-4.5 وClaude 3.7 Sonnet.
توازن وحيادية أكثر في الردود
قالت ميتا إن Llama 4 أصبح أقل تحفظًا في الرد على الأسئلة الجدلية، ويقدم الآن إجابات لموضوعات سياسية واجتماعية كان يرفضها سابقًا. ووصفت النماذج بأنها أصبحت “أكثر توازنًا” في كيفية التعامل مع وجهات النظر المختلفة، وذلك وسط انتقادات من شخصيات سياسية بشأن انحياز بعض نماذج الذكاء الاصطناعي.
ليس نموذج استدلال بعد
رغم قوة Llama 4، إلا أن ميتا أوضحت أن النماذج الجديدة ليست مخصصة للاستدلال الدقيق مثل نماذج OpenAI من فئة o1 وo3-mini، التي تتطلب وقتًا أطول لكنها تقدم ردودًا مدققة أكثر.