تحطيم الصورة النمطية لنماذج الذكاء الاصطناعي.. ببغاء رقمي

نشرت شركة “آبل” دراسة بحثية حديثة ترفع الستار عن أحد أبرز التحديات التي تعترض تطور الذكاء الاصطناعي: افتقار نماذج المحاكاة المنطقية مثل Claude وDeepSeek‑R1 وOpenAI o1/o3 للاستدلال الفعلي، واعتمادها بدلاً من ذلك على تكرار الأنماط من بيانات التدريب.
استندت الدراسة إلى أربعة ألغاز كلاسيكية – برج هانوي، عبور النهر، القفز في لعبة الداما، وعالم المكعبات – تم تصنيفها بحسب الصعوبة. وخلصت إلى تراجع حاد في الأداء كلما زاد تعقيد الألغاز، حيث تنتج النماذج خطوات تشي بوجود “تفكير”، لكنها تخفق عمليًا عند مواجهة تحديات منطقية طويلة الأمد، حتى عند تزويدها بخوارزميات مسبقة للحل.
وأشارت النتائج إلى أن الأداء لا يتحسّن رغم توفير مزيد من الوقت أو الموارد، بل يظهر سلوكًا متناقضًا: بعض الألغاز المتوسطة تحقق فيها النماذج أداءً معقولًا، لكنها تفشل بشكل مفاجئ في مسائل أبسط منها. وتعزز هذه الملاحظات ضرورة إعادة النظر في أساليب التقييم الحالية، التي تركز على الإجابة النهائية وتغفل مدى قدرة النماذج على الاستدلال الحقيقي.
وبينما لا تقلل الدراسة من الفوائد العملية لهذه النماذج، فإنّها تثير تساؤلات جوهرية حول مدى قرب هذه الأساليب من تحقيق “ذكاء اصطناعي عام”، وتدعو إلى تعزيز الاختبارات البحثية بما يعكس قدرات استنتاج حقيقية.



