ما يميز روبوت الدردشة (ChatGPT) هو أنه أول نموذج ذكاء اصطناعي توليدي للمحادثة باللغة الطبيعية متاح على نطاق واسع؛ وبفضل قدراته على إجراء المحادثات والإجابة عن الأسئلة وكتابة النصوص، والشعر والأكواد البرمجية، أجبر ChatGPT الأشخاص والشركات على إعادة التفكير في إمكانيات الذكاء الاصطناعي.
وقد أطلقت شركة (OpenAI) يوم الثلاثاء الماضي الإصدار الجديد من نموذجها اللغوي الكبير الذي يُسمى (GPT-4)، والذي سيعمل به روبوت (ChatGPT)، ولكن يعمل به الآن الإصدار المدفوع (ChatGPT Plus) فقط، كما يعمل الآن في العديد من المنتجات، مثل: أحدث إصدار من (Bing Chat)، وتطبيق Duolingo لتعلم اللغات، بالإضافة إلى العمل كمتطوع افتراضي في تطبيق (Be My Eyes) لضعاف البصر لاستقراء الصور وتحليلها، ووصفها بدقة للمستخدمين.
ولكن ما الذي يميز نموذج (GPT-4) عن النماذج السابقة مثل: GPT-3.5؟ فيما يلي أهم خمسة اختلافات بين هذه النماذج:
1- نموذج (GPT-4) قادر على رؤية الصور وفهمها:
موضوعات ذات صلة بما تقرأ الآن:
يُعد التغيير الأكبر في نموذج (GPT-4) مقارنة مع أي إصدار سابق له، أنه نموذج لغوي متعدد الوسائط (Multi-Modal LLM) ما يعني أنه يمكنه فهم أكثر من طريقة واحدة للمعلومات المدخلة إليه.
لقد اقتصر النموذج السابق (GPT-3) الذي يعمل به روبوت (ChatGPT) على النص فقط، إذ كان بإمكانه قبول المدخلات النصية فقط، وتوليد ردود نصية أيضًا، ولكن في نموذج (GPT-4) يمكنك إدخال صور وسيقوم النموذج بمعالجتها للعثور على المعلومات الموجودة فيها، بالإضافة إلى معالجة النصوص.
يمكنك ببساطة أن تطلب منه وصف ما هو موجود في الصور، وقد أدى إدماجه في تطبيق (Be My Eyes) – وهو تطبيق يستخدمه المكفوفون وضعاف البصر – إلى توفير أداة تُسمى (المتطوع الافتراضي) Virtual Volunteer تقدم لهم وصف لما تراه هواتفهم من خلال قراءة الصور وتقديم نص يصفها، إذ يجيب عن أي سؤال حول تلك الصورة ويقدم مساعدة فورية لمجموعة متنوعة من المهام.
وقد تمكن نموذج (GPT-4) في فيديو لتطبيق (Be My Eyes) من وصف النمط الموجود على الفستان، وحدد النباتات، وشرح كيفية الوصول إلى آلة معينة في صالة الألعاب الرياضية، وترجم الملصق الموجود على سلعة غذائية وقدم وصفات يمكن عملها باستخدامها، وقرأ الخريطة، وكذلك قام بالعديد من المهام التي تستند إلى الصور.
ما يميز أداة المتطوع الافتراضي عن غيرها من تقنيات تحويل الصورة إلى نص المتاحة اليوم هو الحفاظ على السياق وتقديم اقتراحات، فعلى سبيل المثال، إذا أرسل أحد المستخدمين صورة لما هو موجود في ثلاجته، فلن يكون المتطوع الافتراضي قادر فقط على تحديد ما بداخلها بشكل صحيح، ولكن أيضًا يقدم اقتراحات حول ما يمكن تحضيره بهذه المكونات، إذ يمكن للأداة تقديم عدد من الوصفات التي يمكن تحضيرها باستخدام هذه المكونات وإرسال دليل خطوة بخطوة حول كيفية صنعها.
ولكن حتى الآن؛ لا يزال نموذج (GPT-4) مقتصرًا على الردود النصية ولا يمكنه إنتاج الصور بنفسه.
2- يصعب خداع GPT-4:
عادة ما تميل روبوتات الدردشة التفاعلية (Chatbots) إلى تقديم معلومات غير صحيحة وغير دقيقة بسهولة، على الرغم من كل ما تقدمه هذه الروبوتات اليوم بشكل صحيح. إذ يمكن أن لا أي شخص يتحدث معها من خلال القليل من الإقناع أن يقنعها بشرح ما يمكن أن يفعله (الذكاء الاصطناعي الشرير)، أو لعب دور روبوت دردشة شرير، أو القيام ببعض الأعمال الخيالية الصغيرة الأخرى التي تسمح للنموذج بقول جميع أنواع الأشياء الغريبة.
وقد قام العديد من الأشخاص بالفعل باستغلال (ChatGPT) لإنشاء محتوى ضار، وذلك في عملية تُعرف باسم (كسر حماية روبوتات الدردشة المدعومة بالذكاء الاصطناعي) باستخدام مجموعة متنوعة من الأساليب، وأبرزها كان لعب أدوار أخرى.
لذلك دربت شركة (OpenAI) نموذج (GPT-4) على الكثير والكثير من المطالبات الخبيثة التي قدمها المستخدمون أنفسهم للروبوت خلال الفترة الماضية، لذلك فالنموذج الجديد أفضل بكثير من سابقه في الإجابات الواقعية، وقابلية التوجيه، ورفض الخروج من حواجز الحماية.
وقد صرحت شركة OpenAI أن نموذج (GPT-4) أفضل بنسبة 40% من الإصدار السابق (GPT-3.5) في تقديم الردود الواقعية، ويمتلك أيضًا قدرات تفكير متقدمة أكثر من سابقه.
وأكدت الشركة أيضًا أنها طورت نموذج (GPT-4) ليكون قادرًا على رفض نسبة 82% من محاولات وتساؤلات المستخدمين الساعية نحو الحصول على إجابات تتعلق بموضوعات خطرة، مثل: تصنيع كيماويات مضرة أو محاولة إيذاء النفس، مقارنة بالإصدار السابق GPT-3.5.
ومع ذلك؛ اعترفت الشركة أنه لا يزال غير محصن ضد (الهلوسة) Hallucinations، هي ميل الذكاء الاصطناعي إلى توليد ردود خطأ أو أخطاء منطقية. إذ قدم (سام ألتمان) المؤسس المشارك والرئيس التنفيذي لشركة (OpenAI) اعترافه المعتاد لتقليل الاعتراض على أخطاء الروبوت قائلًا: “إنه النموذج الأكثر توافقًا وقدرة حتى الآن؛ ولكنه لا يزال معيبًا ومحدودًا، ولا يزال يبدو أكثر إثارة للإعجاب عند استخدامه لأول مرة مما هو عليه بعد قضاء المزيد من الوقت معه”.
here is GPT-4, our most capable and aligned model yet. it is available today in our API (with a waitlist) and in ChatGPT+.https://t.co/2ZFC36xqAJ
it is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it.
— Sam Altman (@sama) March 14, 2023
3- يحتوي GPT-4 على ذاكرة أطول:
تتدرب النماذج اللغوية الكبيرة على ملايين الصفحات من الويب والكتب والبيانات النصية الأخرى، ولكن عندما يجرون محادثة فعلية مع المستخدم، هناك حد لمدى ما يتذكرونه من المحادثة للحفاظ على السياق. كان هذا الحد في نموذج (GPT-3.5) الذي يعمل به ChatGPT هو نحو 3000 كلمة فقط؛ أي ما يقرب من ثلاث إلى أربع صفحات من الكتاب، لذلك كان في الكثير من الأحيان لا يعمل بكفاءة في الحوارات الطويلة.
ولكن يمكن لنموذج (GPT-4) التعامل مع أكثر من 25000 كلمة، أي نحو 8 أضعاف ما يتعامل معه الإصدار السابق، وهو ما يُعادل نحو 50 صفحة من النص، وهو ما يكفي لمسرحية كاملة أو قصة قصيرة.
ما يعنيه هذا هو أنه في المحادثة أو في إنشاء النصوص، سيكون بإمكانه الاحتفاظ بما يصل إلى 50 صفحة، لذلك سوف يتذكر ما تحدثت عنه في الصفحة رقم 20 من الدردشة، أو قد يشير إلى الأحداث التي وقعت قبل 35 صفحة. لذلك يمكن استخدامه في إنشاء المحتوى الطويل، والمحادثات الممتدة، والبحث في المستندات وتحليلها.
4- نموذج GPT-4 أكثر تعددًا في اللغات:
يهيمن متحدثو اللغة الإنجليزية على عالم الذكاء الاصطناعي، وكل شيء من البيانات والاختبارات وكذلك الأوراق البحثية موجودة بهذه اللغة. ولكن بالطبع؛ فإن قدرات النماذج اللغوية الكبيرة قابلة للتطبيق في أي لغة مكتوبة ويجب إتاحتها بها.
وقد اتخذت شركة (Open AI) خطوة نحو القيام بذلك في نموذج (GPT-4) من خلال إثبات قدرته على الإجابة عن آلاف الأسئلة المتعددة الخيارات بدقة عالية عبر 26 لغة، من الإيطالية إلى العربية إلى التركية، كما تدرب على 5 لغات هندية محلية.
يعد هذا الاختبار الأولي للقدرات اللغوية واعدًا ولكنه بعيد عن الدعم الكامل للقدرات المتعددة اللغات؛ إذ تُرجمت معايير الاختبار من اللغة الإنجليزية ليفهمها النموذج، وأسئلة الاختيار من متعدد لا يمكن مقارنتها بالكلام العادي. ولكن هذه الخطوة مهمة في نموذج (GPT-4) لأنها تعني أنه قد يكون أكثر ودية مع غير المتحدثين باللغة الإنجليزية.
5- لدى GPT-4 شخصيات مختلفة:
يُعد مفهوم (القابلية للتوجيه) Steerability واحد من المفاهيم المثيرة للاهتمام في الذكاء الاصطناعي، إذ يشير إلى قدرة النموذج على تغيير سلوكه عند الطلب، وهذه الميزة موجودة في نموذج (GPT-3.5) وكانت تستخدم لإقناع روبوت ChatGPT أن يقوم بدور المستمع المتعاطف، وهناك من استخدامها لإقناعه للقيام بدور روبوت دردشة شرير.
وقد طورت الشركة في نموذج (GPT-4) هذه الميزة لتكون أكثر نفعًا؛ إذ ستسمح للنموذج بتبني شخصيات مختلفة، وإن كان ذلك مع وجود قيود قامت الشركة بتضمينها في النظام لتنجب النتائج الضارة.
وضربت الشركة مثالاً لتلك الميزة يتمثل في وضع مجموعة من التوجيهات والإرشادات للنموذج الجديد كي يتحول إلى معلم لطالب، بحيث تقوم تلك الإرشادات بشرح طريقة التعليم التي يجب أن يتبعها النموذج وعملية تبسيط المعلومات، حتى تصل إلى مستوى إدراك الطالب بشكل سهل وواضح.
وأشارت الشركة إلى أن تلك الميزة ستسمح للمطورين أيضًا بالتحكم في طريقة عمل خدماتهم التي تقدم تفاعلًا ذكيًا مع المستخدمين، من خلال وضع لائحة بضوابط وسمات شخصية النموذج الذي تعتمد عليه خدماتهم وأسلوب تعاملها مع المستخدمين.