“لغز الأحد” يكشف نقاط ضعف الذكاء الاصطناعي في التفكير المنطقي

برنامج لغز الأحد
Sunday Puzzle

في كل يوم أحد، يستعد آلاف المستمعين داخل الولايات المتحدة والعالم لخوض رحلة مليئة بالتفكير والتحدي مع برنامج “لغز الأحد” (Sunday Puzzle) الذي تبثه إذاعة NPR. ويقدم ألغازًا معقدة تتطلب قدرة عالية على التفكير المنطقي وحل المشكلات.

الاستعداد لبدء برنامج “لغز الأحد”

لم يقتصر هذا التحدي على البشر فقط، بل امتد ليشمل عالم الذكاء الاصطناعي. ففي دراسة حديثة، استخدم باحثون من عدة جامعات أمريكية. بالتعاون مع شركة Cursor الناشئة، ألغاز “لغز الأحد” لاختبار قدرات الذكاء الاصطناعي في الاستدلال المنطقي.

أظهرت النتائج مفاجآت مثيرة للاهتمام. وفيما أظهرت نماذج متقدمة من الذكاء الاصطناعي، مثل o1 من “OpenAI” وR1 من “ديب سيك”، قدرة على معالجة المعلومات وتقديم بعض الإجابات، فإنها واجهت صعوبات كبيرة في التعامل مع الألغاز الأكثر تعقيدًا. وفقًا لموقع techcrunch.

ضعف نقاط الذكاء الاصطناعي

اللافت للانتباه أن هذه النماذج لم تكتف بإعطاء إجابات خاطئة، بل “استسلمت” في بعض الأحيان وأعلنت عجزها عن حل اللغز قبل تقديم إجابة عشوائية غير صحيحة.

برنامج لغز الأحد

ويشير ذلك إلى أن الذكاء الاصطناعي لا يزال يواجه تحديات كبيرة في فهم السياق والتفكير الإبداعي الذي يتطلبه حل هذه الألغاز والاستدلال المنطقي المعقد.

ويؤكد الباحثون أن هذه الألغاز تتمتع بميزة خاصة. فهي لا تعتمد على المعرفة الموسوعية. الأمر الذي يجعلها اختبارًا مثاليًا لقدرات الذكاء الاصطناعي في التفكير المجرد. بدلًا من مجرد استرجاع المعلومات.

 ورغم ذلك، فإن النماذج لا تزال تواجه صعوبات في التعامل مع هذه التحديات. حيث أظهرت سلوكيات غريبة، مثل تقديم إجابة خاطئة ثم التراجع عنها، أو حتى “التفكير” بلا نهاية من دون الوصول إلى حل.

حاليًا، يتصدر نموذج o1 القائمة بأفضل أداء بنسبة 59%، يليه o3-mini بنسبة 47%، في حين حصل R1 على 35% فقط.

وهذه الدراسة تثير تساؤلات مهاة حول قدرات الذكاء الاصطناعي وحدوده. وبينما يتفوق في العديد من المجالات، مثل معالجة البيانات والتعرف على الأنماط، فإنه لا يزال يفتقر إلى القدرة على التفكير الإبداعي وحل المشكلات المعقدة التي تتطلب فهمًا عميقًا للعالم من حولنا.

يبقى برنامج “لغز الأحد” تحديًا مثيرًا للاهتمام لكل من البشر والآلات. إنه يذكرنا بأهمية التفكير النقدي والقدرة على حل المشكلات في عالمنا المتزايد التعقيد.

يشار إلى أن رنامج “لغز الأحد” هو برنامج إذاعي أسبوعي يبث على إذاعة إن بي آر (NPR) الأمريكية. حيث يقدم البرنامج ألغازًا وتحديات منطقية معقدة، ويستقطب آلاف المستمعين الذين يحاولون حل هذه الألغاز.

تاريخ البرنامج وتطوره

وبدأ عرض البرنامج في العام 1987، ويقدمه حاليًا: “ويل شورتز” و”لورا تشاودان”. وقد اكتسب البرنامج شعبية كبيرة على مر السنين، وأصبح جزءًا من الثقافة الشعبية الأمريكية.

الرابط المختصر :