كيف يمكن تمييز النصوص المكتوبة بالذكاء الاصطناعي؟

المحتوي

توليد نصوص المكتوبة من العدم

إمكانية تمييز النص الذي يكتبه البشر

خبراء اللغة لم يحققوا أداءً أفضل

استخدام بعض المفردات غير المعتادة

استخدام بعض علامات الترقيم

تكرار الألفاظ الشائعة والمفردات نادرة الاستخدام

تطبيق “تشات جي.بي.تي”

دخلت تطبيقات الذكاء الاصطناعي حياتنا اليومية بشكل كبير جدًا، حتى أصبحت ظاهرة الكتابة عبر تطبيقاته من الأمور الشائعة، فهل يمكن تمييز هذه النصوص التي يتدخل فيها الـAI.

توليد نصوص المكتوبة من العدم

وصار البعض يستخدمونها في توليد نصوص مكتوبة من العدم. مع إضافة بعض الكلمات أو اللمسات اللغوية لإضفاء صبغة شخصية على النص المكتوب.
السؤال الذي يطرح نفسه بقوة حاليًا هل يُمكن تمييز النصوص المكتوبة بواسطة تطبيقات الذكاء الاصطناعي؟. إذ تعد هذه الظاهرة الجديدة إشكالية للمدرسين والمشرفين الذين يتم تكليفهم بتقييم القدرات الكتابية لطلابهم.

كما أنها تثير قلق بعض الأشخاص الذين يطلبون المشورة فيما يتعلق بمشكلاتهم النفسية والاجتماعية على بعض المنتديات المتخصصة. أو يسعون للحصول على رأي فني بخصوص منتج أو سلعة ما قبل الإقدام على الشراء.

إمكانية تمييز النص الذي يكتبه البشر

من جانبه قال الباحث روجر كرويتس اخصائي علم النفس بجامعة ممفيس الأمريكية، إنه خلال السنوات القليلة الماضية، عكف الباحثون والمتخصصون على محاولة استكشاف مدى إمكانية تمييز النص الذي يكتبه البشر عن النص المصنوع بواسطة تطبيقات الذكاء الاصطناعي على اختلاف أنواعها،

وأشار في مقال نشره الموقع الإلكتروني The Conversation المتخصص في المقالات البحثية. وفقا لوكالة الأنباء الألمانية، إلى أن العديد من الدراسات التي أجريت مؤخرا سلطت الضوء على صعوبة التعرف على النصوص المكتوبة بواسطة برامج الذكاء الاصطناعي.

خبراء اللغة لم يحققوا أداءً أفضل

وأكدت دراسة أجريت عام 2021 أن المشاركين لم يستطيعوا التمييز بين قصص ومقالات صحفية ووصفات لمأكولات معينة كتبها بشر أو صاغتها تطبيقات الذكاء الاصطناعي.

وأشار “كرويتس”، إلى أن خبراء اللغة لم يحققوا أداء أفضل في التعرف على النصوص المصنوعة بواسطة الذكاء الاصطناعي.

وخلال دراسة أخرى أجريت عام 2023، لم يستطع مجلس تحريري يضم كبار الصحفيين المتخصصين في علوم اللغويات تحديد مسودات المقالات التي وضعها كتاب بشر وتمييزها عن المسودات التي صاغها تطبيق “تشات جي.بي.تي”.

وتوصلت دراسة ثانية أجريت عام 2024 أن المصححين بإحدى الجامعات البريطانية لم يستطيعوا اكتشاف 94% من الإجابات التي تم إعدادها بواسطة تطبيق “تشات جي.بي.تي”.

استخدام بعض المفردات غير المعتادة

ويرى كرويتس أن استخدام بعض المفردات غير المعتادة أو النادرة في النص قد تكون مؤشرًا لتحديد هوية الكاتب ومعرفة ما إذا كان من البشر أو من تطبيقات الذكاء الاصطناعي.

ورصد المتخصصون بالفعل زيادة ملحوظة في استخدام بعض الألفاظ غير الشائعة في الأوراق البحثية. خلال السنوات القليلة الماضية مثل delves وتعني “يتعمق” وكلمة crucial وتعني “مهم”.

ومن المعتقد أن استخدام مثل هذه المفردات هو مؤشر على أن تلك النصوص هي من صياغة بعض تطبيقات الذكاء الاصطناعي، وهو ما يظهر أن بعض الباحثين اعتادوا مؤخرا على كتابة أو تحرير أجزاء من أوراقهم البحثية بواسطة مثل هذه التطبيقات.

استخدام بعض علامات الترقيم

وأعرب المشاركون في استطلاع لتحديد أهم السمات التي تميز النصوص المكتوبة بواسطة تطبيقات الذكاء الاصطناعي. عن اعتقادهم أن الإفراط في استخدام بعض علامات الترقيم مثل الشرطة السفلية. التي توضع للفصل بين عبارات أو أفكار معينة أثناء الكتابة قد يكون من المؤشرات الدالة على النصوص المصنوعة بواسطة التطبيقات الإلكترونية.

بيهدد انقراض البشرية.. خبراء يحذرون من مخاطر الذكاء الاصطناعي

ويرى الباحثون أن السبب وراء هذا الاعتقاد أن استخدام مثل هذه النوعية من علامات الترقيم لا يتم إلا بواسطة الكتاب المتمرسين. وبمعنى آخر، ربما يسود اعتقاد أن النص المكتوب بشكل “جيد جدا” هو على الأرجح من تأليف أحد تطبيقات الذكاء الاصطناعي.

ويقول كرويتس إنه من الممكن محاولة التمييز بين النصوص المكتوبة بواسطة البشر أو التطبيقات الإلكترونية من خلال ما يعرف باسم علم “القياس الأسلوبي” Stylometry. الذي يعتمد على تطبيق أساليب إحصائية ولغوية حاسوبية لتحليل النص المكتوب.

وابتكر الباحث الأسترالي جون بوروز المتخصص في علم “الأسلوبية الحاسوبية” تطبيقًا يعرف باسم Burrows Detla.

تكرار الألفاظ الشائعة والمفردات نادرة الاستخدام

ويعتمد هذا الطبيق على قياس مدى تكرار الألفاظ الشائعة والمفردات نادرة الاستخدام في نص معين. كوسيلة لتحديد هوية الكاتب. ولكن من أوجه قصور هذه التقنية أنها تحتاج إلى نصوص طويلة نسبياً حتى تؤتي ثمارها، لاسيما بعد أن أثبتت دراسة أجريت عام 2016. ضرورة ألا يقل حجم النص محل الاختبار عن ألف كلمة على الأقل حتى يتسنى تحديد هوية المؤلف.

واستخدمت بعض الدراسات الحديثة ما يعرف باسم نماذج BERT اللغوية. وهي اختصار لمصطلح Bidirectional Encoder Representations from Transformers أي “تمثيلات التشفير ثنائية الاتجاه من المحولات”. وهي نموذج لغوي يساعد في تحسين فهم الحاسبات للغة البشرية عن طريق تحليل العلاقة بين المفردات داخل النص اللغوي من أكثر من اتجاه.

"Kling" تطبيق ذكاء اصطناعي جديد يحول النص المكتوب لفيديو

ويرى كرويتس أن هذه التقنية يمكنها تمييز النصوص المكتوبة بواسطة تطبيقات الذكاء الاصطناعي بنسب تتراوح ما بين 80% إلى 98%. وإن كانت غير متاحة للمستخدم العادي غير المتخصص.

تطبيق “تشات جي.بي.تي”

ووجه كرويتس نفس الاستفسار إلى تطبيق “تشات جي.بي.تي” وسأله كيف يمكن التعرف على النص المكتوب بواسطة تطبيقات الذكاء الاصطناعي. فأجاب التطبيق نفسه أن هذ الأمر قد يكون صعبًا ولكنه حدد بعض السمات اللغوية التي قد تساعد في اكتشاف مثل هذه النصوص.

وذكر تشات جي.بي.تي أن النصوص المكتوبة بواسطة تطبيقات الذكاء الاصطناعي تتضمن ما يعرف باسم عبارات “التحوط”. التي تعبر عدم اليقين مثل “في كثير من الأحيان” أو “بشكل عام”.

وتتسم هذه النصوص أيضا بسمة “التكرارية”. والاعتماد على أسلوب القوائم أو النقاط، وكذلك استخدام “الأساليب الحيادة المنمقة” مع استخدام بعض الصفات مثل “بشكل ملموس” أو “بشكل ملحوظ”، وقد تتضمن بعض المصطلحات الأكاديمية على غرار “تداعيات” و”تعقيدات” وغيرها.

وأكد التطبيق أنه رغم شيوع هذه السمات في النصوص المكتوبة بواسطة الذكاء الاصطناعي بشكل عام. فإنها لا تتيح إمكانية تحديد النصوص المصنوعة آليا بشكل قاطع.

الرابط المختصر :