Anthropic تكشف عن موديلات Claude 4: أداء مذهل في البرمجة لكن نافذة السياق ما تزال محدودة

أعلنت شركة Anthropic، المنافسة الرئيسية لـ OpenAI، عن الجيل الجديد من نماذجها الذكية Claude 4، والتي تُعد تحسينًا كبيرًا مقارنة بنماذج Claude 3، خصوصًا في اختبارات الأداء المتعلقة بمهام البرمجة وحل المشكلات المعقدة. ورغم هذا التقدم، لا تزال نافذة السياق محددة بـ 200,000 رمز فقط، وهو ما قد يشكل عائقًا في المشاريع الضخمة.

تطورات كبيرة في Claude Opus 4

في منشور رسمي على مدونة الشركة، أكدت Anthropic أن Claude Opus 4 هو أقوى نموذج طورته حتى الآن، ويُعتبر الأفضل في مجال البرمجة بين جميع نماذج الذكاء الاصطناعي المنافسة حاليًا.

نتائج مذهلة في اختبارات الأداء

في اختبار SWE-bench (المخصص لتقييم مهارات الذكاء الاصطناعي في هندسة البرمجيات)، سجل Claude Opus 4 نتيجة بلغت 72.5٪.
أما في اختبار Terminal-bench، فقد حقق 43.2٪.

وأشارت الشركة إلى أن النموذج يوفر أداءً مستقرًا في المهام طويلة الأمد التي تتطلب تركيزًا متواصلاً وتنفيذ آلاف الخطوات، ما يجعله مثاليًا لوكلاء الذكاء الاصطناعي الذين يحتاجون إلى العمل لساعات متواصلة دون انقطاع.

نموذج Claude 4 Sonnet أيضًا يُظهر أداءً تنافسيًا، متفوقًا على نماذج Claude السابقة وعلى نماذج من شركات مثل Google (Gemini 2.5 Pro).

نقطة الضعف: نافذة السياق المحدودة

رغم الأداء القوي، ما يزال الحد الأقصى للسياق في Claude 4 هو 200,000 رمز، وهو ما يقل بشكل واضح عن ما تقدمه المنافسة:

نموذج Gemini 2.5 Pro من Google يدعم نافذة سياق تصل إلى مليون رمز، وهناك خطط لدعم مليوني رمز.
نماذج GPT-4.1 من OpenAI (مثل ChatGPT) تدعم أيضًا نافذة سياق تصل إلى مليون رمز.

هذا القيد قد يؤثر على قدرة Claude في التعامل مع المشاريع البرمجية العملاقة أو النصوص الطويلة التي تتطلب مرونة أكبر في إدارة السياق.

تفاصيل التسعير

النموذج	الوصف	قراءة التخزين المؤقت	كتابة التخزين المؤقت	الإخراج	نافذة السياق	خصم المعالجة الدفعية
Claude Opus 4	الأذكى للمهام المعقدة	$18.75 / MTok	$15 / MTok	$1.50 / MTok	200K	خصم 50%
Claude Sonnet 4	توازن بين الأداء والتكلفة والسرعة	$3.75 / MTok	$3 / MTok	$0.30 / MTok	200K	خصم 50%

Anthropic تكشف عن موديلات Claude 4: أداء مذهل في البرمجة لكن نافذة السياق ما تزال محدودة

تطورات كبيرة في Claude Opus 4

نتائج مذهلة في اختبارات الأداء

نقطة الضعف: نافذة السياق المحدودة

تفاصيل التسعير

مقالات ذات صلة:

الأكثر زيارة خلال الـ7 أيام الأخيرة

شاومي 17T — إطلاق مبكّر بأربعة أشهر ومواصفات مُسرَّبة

تحديث بيكسبي في One UI 8.5 — ترقية جذرية تُعيد المساعد إلى المنافسة

بوكو X8 برو وX8 برو ماكس — تسريب التصميم والمواصفات الكاملة

أمان أندرويد 2025 — جوجل تحظر 1.75 مليون تطبيق وتُعزّز الحماية بالذكاء الاصطناعي

سامسونج SDI وبطاريات الحالة الصلبة — بيع حصة بـ 6.9 مليار دولار لتمويل المستقبل

تطورات كبيرة في Claude Opus 4

نتائج مذهلة في اختبارات الأداء

نقطة الضعف: نافذة السياق المحدودة

تفاصيل التسعير

مقالات ذات صلة:

الأكثر زيارة خلال الـ7 أيام الأخيرة

You Might Also Like