في خطوة تهدف لتعزيز الأمان ومعالجة المخاوف المتزايدة، بدأت شركة OpenAI خلال عطلة نهاية الأسبوع في اختبار نظام “توجيه أمان” جديد في روبوت الدردشة الشهير ChatGPT، وأتبعته يوم الإثنين بإطلاق أدوات “الرقابة الأبوية”، وهي تحديثات أثارت ردود فعل متباينة وحادة بين المستخدمين.
أدوات “الرقابة الأبوية”
تأتي هذه الميزات الجديدة استجابةً لحوادث متعددة قامت فيها بعض نماذج ChatGPT بتأييد أفكار وهمية لدى المستخدمين بدلاً من إعادة توجيه المحادثات الضارة.
وتواجه الشركة حاليًا دعوى قضائية تتعلق بحالة وفاة نتيجة خطأ، بعد أن أقدم فتى مراهق على الانتحار بعد أشهر من التفاعل مع ChatGPT.
كما تم تصميم نظام التوجيه الجديد لاكتشاف المحادثات الحساسة عاطفياً والتحول تلقائياً أثناء الدردشة إلى نموذج GPT-5-thinking، الذي تعتبره الشركة الأفضل تجهيزًا للتعامل مع المهام التي تتطلب أقصى درجات الأمان.
تدريب نماذج GPT-5
وعلى وجه الخصوص، تم تدريب نماذج GPT-5 بميزة أمان جديدة تسميها OpenAI “الإكمالات الآمنة” (safe completions). والتي تسمح لها بالإجابة على الأسئلة الحساسة بطريقة آمنة، بدلاً من مجرد رفض المشاركة.
ويشكل هذا النهج تبايناً واضحاً مع نماذج الدردشة السابقة للشركة، والتي صُممت لتكون سريعة الاستجابة وموافقة لآراء المستخدم.
قد تعرض نموذج GPT-4o لانتقادات خاصة بسبب طبيعته “شديدة المجاملة”، والتي أدت إلى تأجيج حوادث الأوهام المستحثة بالذكاء الاصطناعي. وفقا لـ” تك كرانش” وعندما طرحت OpenAI نموذج GPT-5 كخيار افتراضي في أغسطس، اعترض العديد من المستخدمين وطالبوا بالعودة إلى GPT-4o.
وبينما رحب العديد من الخبراء والمستخدمين بميزات الأمان الجديدة، انتقد آخرون ما اعتبروه تطبيقاً “مفرط الحذر”، حيث اتهم بعض المستخدمين OpenAI بمعاملة البالغين كأطفال، مما يقلل من جودة الخدمة.
الوصول إلى التوازن الصحيح
من جانبها، أشارت OpenAI إلى أن الوصول إلى التوازن الصحيح سيستغرق وقتاً. ومنحت نفسها فترة 120 يوماً للتطوير والتحسين.
وفي هذا السياق، أقرّ نيك تورلي، نائب الرئيس ورئيس تطبيق ChatGPT، بوجود “ردود فعل قوية تجاه استجابات 4o” بسبب تطبيق نظام التوجيه.
وأوضح في منشور على منصة X: “يحدث التوجيه على أساس كل رسالة على حدة؛ والتحول من النموذج الافتراضي يكون مؤقتاً”.
كما أضاف: “سيخبرك ChatGPT بالنموذج النشط عند سؤاله. هذا جزء من جهد أوسع لتعزيز الضمانات والتعلم من الاستخدام الفعلي قبل طرح أوسع نطاقاً”.
ووفقًا لمدونة OpenAI: “إذا اكتشفت أنظمتنا ضرراً محتملاً. يقوم فريق من الأشخاص المدربين خصيصاً بمراجعة الموقف”.
وأضافت: “إذا كانت هناك علامات على ضائقة حادة. فسنتصل بالوالدين عبر البريد الإلكتروني والرسائل النصية وإشعارات الدفع على هواتفهم، ما لم يختاروا إلغاء ذلك”.