أطلقت جوجل يوم الثلاثاء الماضي عائلة جديدة من نماذج الذكاء الاصطناعي للتفكير، وهي Gemini 2.5، التي تتوقف مؤقتًا للتفكير قبل الرد على أي استفسار.
تُطلق جوجل Gemini 2.5 Pro Experimental، وهو نموذج ذكاء اصطناعي متعدد الوسائط للتفكير، والذي تصفه بأنه أذكى نموذج لديها حتى الآن، كأول نموذج في هذه العائلة الجديدة. يوم الثلاثاء، سيكون هذا النموذج متاحًا عبر Google AI Studio، منصة المطورين الخاصة بالشركة، وتطبيق Gemini لمستخدمي Gemini Advanced، وهو اشتراك الذكاء الاصطناعي الذي تقدمه الشركة مقابل 20 دولارًا أمريكيًا شهريًا.
تؤكد جوجل أن مهارات التفكير ستُدمج في جميع نماذج الذكاء الاصطناعي القادمة.
يسابق قطاع تكنولوجيا المعلومات الزمن لمواكبة أو تجاوز قدرات أول نموذج استدلال ذكاء اصطناعي من OpenAI منذ إطلاقه في سبتمبر 2024. في الوقت الحالي، تتطلب نماذج الاستدلال بالذكاء الاصطناعي من Anthropic وDeepSeek وGoogle وxAI قوة معالجة ووقتًا أطول للتحقق من الحقائق وحل المشكلات قبل تقديم الاستجابة.
تقدمت نماذج الذكاء الاصطناعي بشكل ملحوظ في مهام الحساب والترميز بفضل تقنيات الاستدلال. ووفقًا للكثيرين في قطاع التكنولوجيا، ستلعب نماذج الاستدلال دورًا هامًا في وكلاء الذكاء الاصطناعي - وهي أجهزة كمبيوتر مستقلة يمكنها تنفيذ الأنشطة بشكل أساسي دون مساعدة بشرية. مع ذلك، فإن هذه الأنواع أكثر تكلفة.
أصدرت جوجل سابقًا نسخة "مُفكّرة" من Gemini في ديسمبر كجزء من تجاربها على نماذج التفكير بالذكاء الاصطناعي. ومع ذلك، يُعدّ Gemini 2.5 أهمّ جهدٍ بذلته الشركة حتى الآن للتفوق على عائلة نماذج OpenAI "o".
ووفقًا لجوجل، يُحقّق Gemini 2.5 Pro نتائج أفضل في عدد من المقاييس مقارنةً بنماذج الذكاء الاصطناعي الرائدة السابقة وبعض نماذج الذكاء الاصطناعي المنافسة. وتدّعي جوجل أن Gemini 2.5 صُمّم خصيصًا ليكون متميّزًا بشكل استثنائي في إنتاج تطبيقات ويب جذابة بصريًا وتطبيقات برمجة وكيلة.
وتدّعي جوجل أن Gemini 2.5 Pro يتفوّق على نماذج الذكاء الاصطناعي الرائدة من OpenAI وAnthropic ومختبر الذكاء الاصطناعي الصيني DeepSeek، محققًا نسبة 68.6% في اختبار Aider Polyglot، الذي يقيس تحرير الأكواد البرمجية.
مع ذلك، حصل جهاز Gemini 2.5 Pro على 63.8% في اختبار SWE-bench Verified، وهو اختبار آخر يُقيّم مهارات تطوير البرمجيات. هذه النسبة أعلى من اختباري o3-mini من OpenAI وR1 من DeepSeek، ولكنها أقل من اختبار Claude 3.7 Sonnet من Anthropic، الذي حقق 70.3%.
تزعم جوجل أن جهاز Gemini 2.5 Pro يتفوق على معظم الطرز الرائدة المنافسة بنسبة 18.8% في اختبار Humanity's Last Exam، وهو اختبار متعدد الوسائط يتضمن آلاف الأسئلة المُستمدة من الجمهور في الرياضيات والعلوم الإنسانية والعلوم الطبيعية.
أولاً، وفقًا لجوجل، يأتي جهاز Gemini 2.5 Pro مع نافذة سياقية تضم مليون رمز، مما يعني أن نموذج الذكاء الاصطناعي قادر على معالجة حوالي 750,000 كلمة في آن واحد. سلسلة كتب "سيد الخواتم" بأكملها أقصر من ذلك. بالإضافة إلى ذلك، سيدعم جهاز Gemini 2.5 Pro قريبًا ضعف هذا العدد من الرموز (مليونان).
لم تُعلن جوجل عن سعر واجهة برمجة تطبيقات Gemini 2.5 Pro. ووعدت الشركة بإصدار معلومات إضافية في الأسابيع المقبلة.