'> جوجل تطلق Gemini 2.5: نموذج AI ثوري يستخدم الحواسيب كالبشر - MJB Tech Tips

جوجل تطلق Gemini 2.5: نموذج AI ثوري يستخدم الحواسيب كالبشر

جابر بوذيبة
24 مشاهدات
3 دقيقة للقراءة

كشفت شركة جوجل عن نموذج ذكاء اصطناعي جديد يُدعى Gemini 2.5 Computer Use، وهو نموذج يسمح لوكلاء الذكاء الاصطناعي (AI agents) بالتفاعل مع مواقع الويب وواجهات المستخدم تماماً كما يفعل الإنسان. أصبح النموذج متاحاً الآن في نسخة معاينة عامة عبر Gemini API على منصتي Google AI Studio و Vertex AI.

كيف يعمل هذا النموذج المتطور؟

على عكس النماذج التقليدية التي تعتمد على واجهات برمجة التطبيقات (APIs)، يقوم Gemini 2.5 Computer Use بمعالجة لقطات الشاشة لواجهات الويب وإنشاء إجراءات محددة للاستجابة. تتم العملية في حلقة مستمرة:

  1. يتلقى الوكيل مهمة ولقطة شاشة للبيئة الرقمية.
  2. يحلل الواجهة ويعيد إجراءً محدداً (مثل النقر على زر أو الكتابة في حقل).
  3. يتم تنفيذ الإجراء على جهاز المستخدم (client side).
  4. تُرسل لقطة شاشة جديدة إلى النموذج لمواصلة المهمة.

قدرات تفوق المنافسين

يبني هذا النموذج على قدرات الفهم البصري والاستدلال المتقدمة الموجودة في Gemini 2.5 Pro. يمكنه أداء مجموعة واسعة من الإجراءات المستندة إلى المتصفح، مثل:

  • النقر والكتابة والتمرير.
  • التحويم فوق العناصر (hovering).
  • فتح القوائم المنسدلة والتنقل عبر الروابط.

تقول جوجل إن النموذج يتفوق على الأدوات المنافسة في عدة اختبارات معيارية مثل Online-Mind2Web و WebVoyager، مع الحفاظ على زمن استجابة (latency) أقل. وقد عرضت جوجل أداء النموذج في أمثلة عملية، مثل فرز الملاحظات على لوحة بيضاء رقمية ونقل تفاصيل حيوان أليف من موقع ويب إلى نظام CRM.

القيود وإجراءات الأمان

يدعم النموذج حالياً 13 إجراءً ويعمل بشكل أفضل مع متصفحات الويب، لكنه ليس مُحسّناً بعد للمهام على مستوى نظام تشغيل سطح المكتب.

طبقت جوجل أيضاً إجراءات أمان لمنع سوء الاستخدام، حيث تتم مراجعة كل إجراء يقترحه النموذج من قبل خدمة أمان قبل التنفيذ. ويمكن للمطورين تقييد إجراءات معينة أو طلب تأكيد صريح من المستخدم للمهام عالية الخطورة مثل المعاملات المالية.

الاستخدامات الحالية والمستقبلية

تستخدم العديد من فرق جوجل الداخلية النموذج بالفعل في مهام اختبار واجهات المستخدم والأتمتة عبر منصات مثل البحث (Search) و Firebase. وقد استخدمه المطورون الخارجيون في بناء أدوات لأتمتة سير العمل والمساعدة الذكية.

يمكن للمطورين البدء في استخدام النموذج عبر Google AI Studio أو Vertex AI، كما توفر جوجل بيئة تجريبية عبر Browserbase للاختبار والتجربة.

📡 لمزيد من التحديثات اليومية، تفضل بزيارة قسم الأخبار على موقعنا.

ابقَ في صدارة المشهد التقني! 🔍
انضم إلى مجتمعنا على تيليغرام لتصلك أبرز الأخبار أولاً بأول! 💡

مقالات ذات صلة:

شارك هذه المقالة
تابع:
تقني سامي في إدارة وأمن الشبكات المعلوماتية ، مطور ويب ومؤسس موقع MJB Tech Tips ، مهتم بمواضيع اﻷمن المعلوماتي وأنظمة لينكس.

ابدأ المناقشة في forum.mjbtechtips.com

PNFPB Install PWA using share icon

Install our app using add to home screen in browser. In phone/ipad browser, click on share icon in browser and select add to home screen in ios devices or add to dock in macos

إدارة الإخطارات

notification icon
اشترك للحصول على آخر أخبار وجديد عالم التقنية من تطبيقات إلى أحدث اﻷجهزة من مختلف الشركات الكبرى.
notification icon
أنت مشترك في الإخطارات
notification icon
اشترك للحصول على آخر أخبار وجديد عالم التقنية من تطبيقات إلى أحدث اﻷجهزة من مختلف الشركات الكبرى.
notification icon
أنت مشترك في الإخطارات