في اعتراف صريح يعكس حجم التحديات الأمنية التي تواجه الذكاء الاصطناعي التوليدي أقرت شركة “OpenAI” بأن هجمات “حقن الأوامر” (Prompt Injections) مخاطرة لن تختفي في أي وقت قريب.
وفي حينزتعمل الشركة على تحصين متصفحها الجديد المعتمد على الذكاء الاصطناعي Atlas. يثير هذا التصريح تساؤلات جوهرية حول مدى أمان ترك “الوكلاء الرقميين” (AI Agents) يعملون بحرية على شبكة الإنترنت المفتوحة.
معضلة أمنية بلا حل نهائي
بينما شبهت “أوبن إيه آي” في مدونة رسمية نشرتها مؤخرًا. هجمات حقن الأوامر بعمليات “الاحتيال والهندسة الاجتماعية” التي تعاني منها الويب منذ عقود. مؤكدة أنه من المستبعد “حلها بالكامل” أبدًا.
كما أقرت الشركة بأن تفعيل “وضع الوكيل” (Agent Mode) في ChatGPT Atlas. الذي يسمح للذكاء الاصطناعي باتخاذ إجراءات نيابة عن المستخدم، يوسع بشكل كبير “سطح التهديد الأمني”.
كذلك كان باحثون أمنيون أثبتوا فور إطلاق المتصفح في أكتوبر الماضي. سهولة التلاعب بسلوك المتصفح عبر كتابة كلمات بسيطة مخفية في مستندات “جوجل” أو رسائل البريد الإلكتروني.
وهو ما أكدته شركة “Brave” أيضًا، واصفة “حقن الأوامر غير المباشر” بأنه تحدٍ منهجي يواجه كل المتصفحات المدعومة بالذكاء الاصطناعي. بما فيها “Comet” التابع لشركة “Perplexity”.
سلاح «OpenAI» السري
لمواجهة هذه المهمة الشاقة التي وصفتها التقارير بـ “السيزيفية” (نسبة إلى العمل الشاق الذي لا ينتهي). كشفت “أوبن إيه آي” عن نهج مبتكر يعتمد على دمج الدفاع بالهجوم.
في حين طورت الشركة ما أسمته “المهاجم الآلي المعتمد على نماذج اللغة الكبيرة” (LLM-based automated attacker).
هذا المهاجم هو عبارة عن “بوت” تم تدريبه باستخدام التعلم المعزز (Reinforcement Learning) ليؤدي دور القراصنة. إذ يتولى البحث عن ثغرات لتمرير تعليمات خبيثة لوكيل الذكاء الاصطناعي في بيئة محاكاة؛ حيث يمكنه دراسة تفكير الوكيل وردود أفعاله، وتعديل الهجوم مرارًا وتكرارًا حتى ينجح في اختراقه.
وتقول الشركة إن هذا النظام سمح لها باكتشاف إستراتيجيات هجوم مبتكرة لم تظهر في حملات “الفحص البشري” (Red Teaming) أو التقارير الخارجية. ما يمنحها القدرة على سد الثغرات قبل استغلالها في “العالم الحقيقي”. وفقًا لـ”تك كرانش”.
سيناريوهات مرعبة
بينما في تجربة توضيحية أظهرت الشركة كيف تمكن “المهاجم الآلي” من دس بريد إلكتروني خبيث في صندوق وارد المستخدم. وبمجرد مسح وكيل الذكاء الاصطناعي للبريد اتبع التعليمات المخفية وأرسل “رسالة استقالة” بدلًا من صياغة رد “خارج المكتب” كما كان مفترضًا.
ومع التحديثات الأمنية الجديدة أصبح “وضع الوكيل” قادرًا على اكتشاف هذه المحاولات وتنبيه المستخدم.
هذا التوجه يتماشى مع تحذيرات “المركز الوطني للأمن السيبراني” في المملكة المتحدة، الذي أكد أن هذه الهجمات قد لا يتم القضاء عليها كليًا، داعيًا المحترفين إلى التركيز على “تقليل الأثر” بدلًا من انتظار “الإيقاف التام”.





















