بعد إطلاقها لنموذج التفكير العميق Ernie X1.1 مؤخرًا، فاجأت شركة بايدو مجتمع الذكاء الاصطناعي مرة أخرى بإصدار PP-OCRv5، وهو نموذج جديد للتعرف الضوئي على الحروف (OCR) أصبح متاحًا الآن على منصة Hugging Face. يتميز هذا النموذج بقدرته الفائقة على قراءة النصوص بدقة، مع الحفاظ على حجم خفيف الوزن وكفاءة مذهلة.
لماذا يتفوق PP-OCRv5 على النماذج العملاقة؟
تعاني نماذج الرؤية اللغوية الضخمة التي نسمع عنها باستمرار من صعوبة في قراءة النصوص المنظمة بدقة. لحل هذه المشكلة، صممت بايدو نموذج PP-OCRv5 خصيصًا لمعالجة هذه القيود.
يعمل النموذج على مرحلتين رئيسيتين:
- تحديد النص: يقوم أولاً بتحديد موقع النص داخل الصورة.
- قراءة النص: بعد ذلك، يقوم بقراءة ما يقوله هذا النص.
يساعد هذا النهج المزدوج على تحديد مكان ظهور النص بدقة ورسم مربعات دقيقة حوله، وهو أمر مفيد للغاية لاستخلاص البيانات من المستندات أو تحليل النماذج.
كفاءة مذهلة في نموذج خفيف الوزن
الكفاءة هي السمة الأبرز في هذا النموذج. فهو يحتوي على 0.07 مليار معلمة فقط، وهو رقم ضئيل جدًا مقارنة بالنماذج العملاقة في هذا المجال. وعند اختباره على أجهزة محمولة، وجد باحثو بايدو أنه يمكنه معالجة أكثر من 370 حرفًا في الثانية على معالج Intel Xeon. هذا يعني أنه يمكن تشغيله على أجهزة الكمبيوتر العادية أو حتى الأجهزة الطرفية (Edge Devices) دون الحاجة إلى مزارع خوادم ضخمة.
أداء متفوق ودعم متعدد اللغات
عندما وضعت بايدو نموذج PP-OCRv5 في مواجهة مباشرة مع الأسماء الكبيرة مثل GPT-4o و Gemini 2.5 Pro و Qwen2.5-VL في مهام التعرف الضوئي على الحروف، تفوق نموذجها بشكل واضح.
يتعامل النموذج مع النصوص المطبوعة والمكتوبة بخط اليد بشكل جيد، وهو لا يقتصر على اللغة الإنجليزية فقط، بل يدعم اللغة الصينية المبسطة والتقليدية، اليابانية، البينيين، العربية، وأكثر من 40 لغة في المجموع.
متاح للجميع على Hugging Face
أتاحت بايدو هذا النموذج للجميع عبر منصة Hugging Face، مما يجعله خيارًا عمليًا للمطورين والشركات التي تتعامل مع الكثير من المستندات متعددة اللغات أو تحتاج ببساطة إلى قدرات OCR قوية دون العبء التشغيلي للنماذج الضخمة. إنه يمثل حلاً فعالاً ينجز المهمة بدقة وكفاءة.
📡 لمزيد من التحديثات اليومية، تفضل بزيارة قسم الأخبار على موقعنا.
ابقَ في صدارة المشهد التقني! 🔍
انضم إلى مجتمعنا على تيليغرام لتصلك أبرز الأخبار أولاً بأول! 💡
ابدأ المناقشة في forum.mjbtechtips.com