أعلنت شركة Anthropic، المنافسة الرئيسية لـ OpenAI، عن الجيل الجديد من نماذجها الذكية Claude 4، والتي تُعد تحسينًا كبيرًا مقارنة بنماذج Claude 3، خصوصًا في اختبارات الأداء المتعلقة بمهام البرمجة وحل المشكلات المعقدة. ورغم هذا التقدم، لا تزال نافذة السياق محددة بـ 200,000 رمز فقط، وهو ما قد يشكل عائقًا في المشاريع الضخمة.
تطورات كبيرة في Claude Opus 4
في منشور رسمي على مدونة الشركة، أكدت Anthropic أن Claude Opus 4 هو أقوى نموذج طورته حتى الآن، ويُعتبر الأفضل في مجال البرمجة بين جميع نماذج الذكاء الاصطناعي المنافسة حاليًا.
نتائج مذهلة في اختبارات الأداء
- في اختبار SWE-bench (المخصص لتقييم مهارات الذكاء الاصطناعي في هندسة البرمجيات)، سجل Claude Opus 4 نتيجة بلغت 72.5٪.
- أما في اختبار Terminal-bench، فقد حقق 43.2٪.
وأشارت الشركة إلى أن النموذج يوفر أداءً مستقرًا في المهام طويلة الأمد التي تتطلب تركيزًا متواصلاً وتنفيذ آلاف الخطوات، ما يجعله مثاليًا لوكلاء الذكاء الاصطناعي الذين يحتاجون إلى العمل لساعات متواصلة دون انقطاع.
نموذج Claude 4 Sonnet أيضًا يُظهر أداءً تنافسيًا، متفوقًا على نماذج Claude السابقة وعلى نماذج من شركات مثل Google (Gemini 2.5 Pro).
نقطة الضعف: نافذة السياق المحدودة
رغم الأداء القوي، ما يزال الحد الأقصى للسياق في Claude 4 هو 200,000 رمز، وهو ما يقل بشكل واضح عن ما تقدمه المنافسة:
- نموذج Gemini 2.5 Pro من Google يدعم نافذة سياق تصل إلى مليون رمز، وهناك خطط لدعم مليوني رمز.
- نماذج GPT-4.1 من OpenAI (مثل ChatGPT) تدعم أيضًا نافذة سياق تصل إلى مليون رمز.
هذا القيد قد يؤثر على قدرة Claude في التعامل مع المشاريع البرمجية العملاقة أو النصوص الطويلة التي تتطلب مرونة أكبر في إدارة السياق.
تفاصيل التسعير
النموذج | الوصف | قراءة التخزين المؤقت | كتابة التخزين المؤقت | الإخراج | نافذة السياق | خصم المعالجة الدفعية |
---|---|---|---|---|---|---|
Claude Opus 4 | الأذكى للمهام المعقدة | $18.75 / MTok | $15 / MTok | $1.50 / MTok | 200K | خصم 50% |
Claude Sonnet 4 | توازن بين الأداء والتكلفة والسرعة | $3.75 / MTok | $3 / MTok | $0.30 / MTok | 200K | خصم 50% |
ابدأ المناقشة في forum.mjbtechtips.com