في الوقت الذي يدخل فيه الذكاء الاصطناعي إلى عدّة مجالات، منها «الصحية، والصناعية، والتعليمية» وغيرها الكثير، كشف باحثون من معهد بايت دانس للأبحاث وجامعة تسينغهوا الصينية، عن دراسة مشتركة تشير إلى أنّ نماذج توليد الفيديو بالذكاء الاصطناعي الحالية مثل Sora من شركة OpenAI، رغم قدرتها على إنشاء تأثيرات بصرية مذهلة، إلا أنّها غير قادرة على فهم القوانين الفيزيائية الأساسية، وفق ما أوردته مجلة The Decoder المتخصصة في الذكاء الاصطناعي.
نماذج بالذكاء الاصطناعي في الفيزياء
المجلة أشارت إلى أنّ فريق البحث اختبر نماذج بالذكاء الاصطناعي في ظل سيناريوهين مختلفين، الأول التنبؤ في ظل أنماط معروفة، والثاني التنبؤ في ظل أنماط غير معروفة، وكان هدفهم تحديد ما إذا كانت هذه النماذج تفهم القوانين الفيزيائية أم لا.
الباحثون وجدوا أنّ نماذج الذكاء الاصطناعي لم تفهم القوانين القابلة للتطبيق، وبدلا من ذلك اعتمدت بشكل أساسي على سمات مثل اللون والحجم والسرعة والشكل عند إنشاء مقاطع الفيديو، وفق اللون والحجم والسرعة والشكل.
المجلة بيّنت أنّه رغم أداء هذه النماذج المثالي في نواحٍ مختلفة، إلا أنّها كانت عاجزة عن مواجهة حالات جديدة لم يتم تدريبها عليها، وأظهر أحد الاختبارات في الدراسة قيود نماذج الذكاء الاصطناعي في التعامل مع حركة الأشياء، على سبيل المثال، عندما تم تدريب النموذج باستخدام كرة سريعة الحركة تتأرجح ذهابًا وإيابًا، فقد أظهر تغييرًا مفاجئًا في الاتجاه عند تقديم كرة بطيئة الحركة أثناء الاختبار، وفق المجلة المتخصصة في الذكاء الاصطناعي.
تحديات مشروع Sora
نتائج الدراسة شكلت تحديًا لنموذج Sora التابع لشركة OpenAI، حيث زعمت الشركة أنّ Sora لديه القدرة على التطور إلى نموذج عالمي حقيقي من خلال التوسع المستمر، بل وأكدت أنّه يتمتع بفهم أساسي للتفاعلات الفيزيائية والهندسة ثلاثية الأبعاد، ومع ذلك أشار الباحثون إلى أنّ مجرد التوسع لا يكفي لنماذج توليد الفيديو لاكتشاف القوانين الفيزيائية الأساسية.
ما الحلول المقترحة؟
الباحثون أشاروا إلى أنّ مجرد زيادة حجم النموذج أو إضافة المزيد من بيانات التدريب لا يحل المشكلة، فرغم أنّ النماذج الأكبر حجمًا تعمل بشكل أفضل في ظل الأنماط والتركيبات المألوفة، إلا أنّها لا تزال تفشل في فهم القوانين الفيزيائية الأساسية أو التعامل مع السيناريوهات خارج نطاق تدريبها.