GPT وClaude وGemini يتعثرون في اختبار تركيز يتفوّق فيه البشر منذ عقود

يونيو 12, 2026

51

دراسة تكشف ضعف GPT وGemini في اختبارات التركيز

كشفت دراسة حديثة أجراها فريق بحثي بقيادة العالم سوكيتو باتيل أن نماذج الذكاء الاصطناعي اللغوية المتقدمة، بما في ذلك GPT وClaude وGemini، تحقق نتائج قوية في اختبارات الانتباه القصيرة، لكنها تواجه صعوبة كبيرة في الحفاظ على دقة الأداء عندما تصبح المهام أطول وأكثر تعقيداً.

واعتمد الباحثون على اختبار «ستروب» الشهير، وهو أحد أكثر الاختبارات استخداماً في علم النفس لقياس التركيز والتحكم الذاتي والقدرة على مقاومة المشتتات. ويقوم الاختبار على عرض كلمات تمثل ألواناً مختلفة، بينما يُطلب من المشارك تحديد لون الكتابة بدلاً من قراءة الكلمة نفسها، وهي مهمة تبدو بسيطة لكنها تتطلب قدراً عالياً من الانتباه المستمر.

تراجع حاد مع زيادة طول المهمة

أظهرت النتائج أن نموذج GPT-4o حقق دقة بلغت 91% عند التعامل مع قوائم قصيرة تضم خمس كلمات فقط. لكن الأداء تراجع بشكل ملحوظ مع زيادة عدد الكلمات، حيث انخفضت الدقة إلى 57% في القوائم المكونة من 10 كلمات، ثم إلى 15% فقط عند الوصول إلى 40 كلمة.

أما نموذج Claude 3.5 Sonnet فحافظ على استقرار أفضل نسبياً في المراحل الأولى، إلا أن دقته هبطت أيضاً إلى 24% عند اختبار القوائم الأطول. وسُجل نمط مشابه لدى نماذج أخرى مثل GPT-5 وClaude Opus 4.1 وGemini 2.5.

لماذا يتفوق الإنسان؟

لاحظ الباحثون أن النماذج واجهت صعوبة أكبر عند مزج كلمات متطابقة مع ألوانها وأخرى متعارضة معها، إذ تراجعت الدقة في بعض الحالات إلى مستويات شبه معدومة. وخلصت الدراسة إلى أن الذكاء الاصطناعي يميل مع مرور الوقت إلى تجاهل التعليمات الأساسية والعودة إلى السلوك الأكثر ترسخاً لديه، وهو قراءة النصوص بدلاً من التركيز على لونها.

في المقابل، يتمكن معظم البشر من الحفاظ على مستوى ثابت من الانتباه حتى خلال الاختبارات الطويلة، رغم أن قراءة الكلمات تُعد استجابة تلقائية أسرع من تحديد الألوان. ويرى الباحثون أن هذه النتائج تسلط الضوء على الفجوة الحالية بين آليات التفكير البشري وطريقة عمل النماذج اللغوية الحديثة، خاصة في المهام التي تتطلب تركيزاً مستمراً ومقاومة للمشتتات.

المادة السابقة

عطل مفاجئ يربك مستخدمي فيسبوك وإنستغرام.. وميتا تعد بإصلاح المشكلة

المقالة القادمة

المغرب ضد البرازيل 2026

GPT وClaude وGemini يتعثرون في اختبار تركيز يتفوّق فيه البشر منذ عقود

تراجع حاد مع زيادة طول المهمة

لماذا يتفوق الإنسان؟

لماذا يفضّل مستخدمو أندرويد الانتقال إلى آيفون؟ السبب ليس ما تتوقعه

هل يؤدي تنظيف الذاكرة العشوائية إلى تسريع الهاتف؟ تجربة تكشف الحقيقة

راوتر قديم قد يفتح الباب للاختراق: ما الذي يجب الانتباه له؟

الأكثر شعبية

لماذا يفضّل مستخدمو أندرويد الانتقال إلى آيفون؟ السبب ليس ما تتوقعه

إطلاق مبادرة “رقميتها” لتعزيز تمكين المرأة رقمياً في الأردن

منتدى الاستراتيجيات: الممرات الاقتصادية فرصة ذهبية لتعزيز صادرات الأردن

مواقف “اركن وتنقّل” الذكية على طاولة الحكومة لتخفيف ازدحام عمّان

التعليقات الأخيرة

اختيارات المحرر

لماذا يفضّل مستخدمو أندرويد الانتقال إلى آيفون؟ السبب ليس ما تتوقعه

إطلاق مبادرة “رقميتها” لتعزيز تمكين المرأة رقمياً في الأردن

منتدى الاستراتيجيات: الممرات الاقتصادية فرصة ذهبية لتعزيز صادرات الأردن

المنشورات الشعبية

24 آب موعد بدء دوام الطلبة في المدارس الحكومية للعام الدراسي 2025-2026

إطلاق الخطة الاستراتيجية الجديدة للتعليم في الأردن 2026-2030: نحو تحول جذري في الفكر التربوي

التربية تدعو مرشحي وظائف المعلمين 2025 للاختبار الإلكتروني – إليك الرابط

الفئة الشعبية

من نحن

تابعنا