تحولت هلوسة الذكاء الاصطناعي، التي كانت تعد في السابق مجرد نزوات مسلية، إلى مشاكل مالية تقدر بملايين الدولارات بالنسبة للشركات التي تستخدم الذكاء الاصطناعي.
ما هي هلوسة الذكاء الاصطناعي؟
تصاب روبوتات الدردشة المخصصة لخدمة العملاء بحالة تسمى “الهلوسة”؛ حيث تصف بكل ثقة منتجات غير موجودة. وأيضًا تخترع معلومات مالية، وتقدم بيانات للأسواق غير صحيحة. كما يقدم روبوت الرعاية الصحية نصائح طبية خطيرة.
لهذا السبب أطلقت شركة Patronus AI، وهي شركة ناشئة في سان فرانسيسكو. أول منصة لمنع هلوسة الذكاء الاصطناعي.
وهي منصة ذاتية الخدمة للكشف عن أعطال الذكاء الاصطناعي ومنعها في الوقت الفعلي. وتعمل وكأنها مدقق إملائي متطور لأنظمة الذكاء الاصطناعي؛ بهدف التقاط الأخطاء قبل وصولها إلى المستخدمين.
ووفق موقع VentureBea t. فإن شركة Patronus AI تسمح للعملاء بكتابة ما يريدون تقييمه والتحقق منه باللغة الإنجليزية. من خلال هذه القواعد تحدد شركات الخدمات المالية قواعد التي يجب الامتثال لها.
في حين أن الشركات التي تقدم الرعاية الصحية تحدد كل ما يخص المريض من الناحية الطبية بكل دقة.
من جهته قال أناند كانابان؛ الرئيس التنفيذي لشركة Patronus AI. إن عديدًا من الشركات التي باتت تستخدم الذكاء الاصطناعي تعاني من هلوسته. حتى إنها تواجه قضايا مثل: الثغرات الأمنية، والسلوك غير المتوقع من روبوتات الدردشة. بالإضافة لوجود مخاطر عالية.
فيما وجدت الأبحاث الأخيرة، التي أجرتها الشركة، أن نماذج الذكاء الاصطناعي الكبرى، مثل GPT-4، تعيد إنتاج المحتوى المحمي بحقوق الطبع والنشر بنسبة 44%. فيما تولد نماذج الذكاء الاصطناعي المتقدمة إجابات غير آمنة بنسبة تزيد على 20%.
لكن ما يميز منصة Patronus AI لمنع هلوسة الذكاء الاصطناعي هو تركيزها على التحسين بدلًا من مجرد اكتشاف أخطاء روبوتات الدردشة. حيث تسلط الضوء على النص المحدد الذي توجد فيه الهلوسة. ما يتيح للمهندسين تحديد المشكلات وإصلاحها بسرعة.
كما تبدأ أسعار الشركة من 10 دولارات لكل 1000 مكالمة من API للربوتات الدردشة الصغيرة. و20 دولارًا لكل 1000 مكالمة API للأكثر تطورًَا.
بينما يجعل ذلك خدماتها متاحة للشركات الناشئة والشركات الصغيرة التي لم تتمكن سابقًا من تحمل تكاليف مراقبة الذكاء الاصطناعي المتطورة.
نماذج اكتشاف هلوسة الذكاء الاصطناعي
تعد Lynx منصة مبتكرة لكشف هلوسة الروبوتات. وتتفوق على GPT-4 بنسبة 8.3% في اكتشاف الأخطاء الطبية. وهي تعمل بسرعتين:
- نسخة سريعة الاستجابة للمراقبة في الوقت الفعلي.
- نسخة أكثر شمولًا للتحليل الأعمق.
علاوة على ذلك طورت الشركة أدوات متخصصة مثل CopyrightCatcher. التي تكتشف متى تعيد أنظمة الذكاء الاصطناعي إنتاج المحتوى المحمي وفق حقوق الملكية الفكرية.
إضافة إلى أداة FinanceBench، وهي معيار لتقييم أداء الذكاء الاصطناعي في المسائل المالية. وتعمل هذه الأدوات بالتنسيق مع Lynx لتوفير تغطية شاملة ضد هلوسة الذكاء الاصطناعي.
















