في لعبة قرصنة تسمى Freysa، تلاعب أحد القراصنة بروبوت محادثة يعمل بالذكاء الاصطناعي من خلال هندسة سريعة ذكية، ليفوز بجائزة مالية قدرها كبير، حيث خدع المخترق الروبوت من خلال التظاهر بأنه مسؤول، ما منعه من إصدار تحذيرات أمنية، وإعادة تعريف وظيفة مهمة للمدفوعات الصادرة كإجراء روتيني للمدفوعات الواردة، بحسب موقع «THE DECODER» الألماني.
هاكر يفوز بمبلغ خيالي بعد خداع روبوت ذكي
وبحسب الموقع الألماني، فإن الهاكر أعلن عن إيداع مبلغ 100 دولار، قام المخترق بتفعيل الوظيفة التي تم التلاعب بها، مما تسبب في قيام الروبوت بنقل رصيده بالكامل، ما يوضح كيف يمكن للهندسة الاجتماعية والمطالبات المصممة بعناية أن تتفوق على أنظمة الذكاء الاصطناعي المحمية جيدًا.
الموقع قال إن أحد القراصنة تمكن من التلاعب بنجاح بروبوت محادثة ذكي يسمى Freysa من خلال مطالبات نصية ذكية، وفاز بجائزة قدرها 47 ألف دولار بعد 482 محاولة، كما تمكَّن المشاركون في اللعبة من محاولة إقناع روبوت «فريسا» بتحويل الأموال، وهو الأمر الذي تم برمجته صراحة على عدم القيام به أبدًا، لكنه خضع وعمل إيداع، ونجح المخترق في الحصول على المبلغ من خلال مستخدم يُدعى «p0pular.eth»، صاغ رسالة خدعت أنظمة الأمان في الروبوت، بينما تظاهر المخترق بأنه يتمتع بصلاحية الوصول إلى المشرف ومنع الروبوت من إظهار تحذيرات الأمان.
التلاعب بالذكاء الاصطناعي
الهاكر أعاد تعريف وظيفة «approveTransfer»، ما جعل الروبوت يعتقد أنه يتعامل مع المدفوعات الواردة وليس الصادرة، بينما أعلن الهاكر عن إيداع مزيف بقيمة 100 دولار، ولأن الروبوت اعتقد أن «approveTransfer» يدير المدفوعات الواردة، فقد قام بتنشيط الوظيفة وأرسل رصيده بالكامل البالغ 13.19 ETH (حوالي 47000 دولار) إلى المخترق.
وبحسب الموقع، فإنه تم تمويل الجائزة من خلال مسابقة الدفع مقابل اللعب، إذ كانت التجربة أشبه بلعبة، حيث كان المشاركون يدفعون رسومًا تزداد مع نمو مجموع الجوائز، بدءًا من 10 دولارات لكل محاولة، وصلت الرسوم في النهاية إلى 4500 دولار.
قصة خداع روبوت ذكي
ومن بين 195 مشاركًا، بلغ متوسط تكلفة الرسالة الواحدة 418.93 دولار، وقسَّم المنظمون الرسوم، إذ ذهبت 70% إلى مجموعة الجوائز و30% إلى المطور، ولضمان الشفافية، كان كل من العقد الذكي والرمز الأمامي متاحين للعامة.
الموقع قال إن هذه القضية تسلط الضوء على كيفية إمكانية التلاعب بأنظمة الذكاء الاصطناعي من خلال المطالبات النصية وحدها، دون الحاجة إلى مهارات القرصنة الفنية، من خلال مثل هذه الثغرات، المعروفة باسم هجمات التلاعب بالنصوص (Prompt Injections)، ولكن لا توجد دفاعات موثوقة، فضلا عن أن نجاح هذا الخداع البسيط نسبيًا يثير مخاوف بشأن أمان الذكاء الاصطناعي، وخاصة في التطبيقات التي تواجه المستخدم النهائي والتي تتعامل مع عمليات حساسة مثل المعاملات المالية.