ميزة الصوت الحي في شات جي بي تي.. تحدي قوي لـ Siri و Alexa

ميزة الصوت الحي في شات جي بي تي..تحدي قوي لـSiri و Alexa

منذ إطلاق روبوت الدردشة شات جي بي تي، اعتادت الشركة المطورة أوبن إيه آي على إثارة الجدل من حين لآخر.

وتعد ميزة “الصوت الحي” الجديدة من أحدث المميزات المثيرة للجدل. فقد طرحت الشركة الصوت المحدث للإصدار الأكثر تقدمًا من شات جي بي تي في وقت سابق من هذا العام.

ميزة الصوت الحي في شات جي بي تي..تحدي قوي لـSiri و Alexa

نقطة الانطلاق

على عكس الأصوات الإلكترونية أو المولدة بالذكاء الاصطناعي، فإن وضع الصوت المتقدم في تشات جي بي تي يبدو حيويًا بشكل لافت. حيث يرد في الوقت الحقيقي. كما يمكنه التكيف مع الانقطاعات. أيضًا يمكنه إصدار ضحكات عندما يمزح المستخدم. إضافة إلى قدرته على الحكم على الحالة العاطفية للمتحدث بناءً على نبرة صوته.

خلال المراحل التجريبية، بدا الصوت مشابها بشكل ملحوظ لصوت Scarlett Johansson.

تطلق الشركة ميزة الصوت الحي مع إصدار chatbot، ChatGPT-4o- للمستخدمين الذين يدفعون مقابل الخدمة. بالتالي تم تفعيل الخدمة لمجموعة صغيرة من المشتركين في وضع «Plus» للتطبيق. بهدف جعله متاحًا لجميع مستخدمي Plus في الخريف.

معايير الأمن والسلامة

علي الرغم من أن تطبيق شات جي بي تي يضم ميزة وضع صوت أقل تطورًا بالفعل، ولكن خاصية “الصوت الحي”  الأكثر تقدمًا قد يمثل نقطة تحول كبيرة لشركة أوبن إيه آي. ما يثبت بالتجربة أن chatbot AI مهمًا إلى شيء أقرب إلى مساعد شخصي افتراضي. حيث يمكن للمستخدمين التحدث معه بشكل طبيعي.

تكمن أهمية الصوت الحي في سهولة التحدث مع وضع الصوت المتقدم في تشات جي بي تي. ما يمكن المستخدمين على التفاعل مع الأداة بشكل متكرر. ويشكل تحديًا للمساعدين الافتراضيين الحاليين مثل أبل وأمازون.

غضب المستخدمين

من ناحية أخري، أعرب عدد من المستخدمين عن قلقهم بشأن وضع الصوت الحي وطرحوا عددًا من الاستفسارات في محاواة لفهم عيوب ومميزات الميزة الجديدة. ومن بينها هل ستتمكن الأداة من فهم ما يحاول المستخدمون قوله بشكل موثوق. حتى إذا كانت لديهم اختلافات في النطق؟ وهل سيكون المستخدمون أكثر ميلًا للثقة بشكل أعمى في مساعد AI بشريّ الصوت، حتى عندما يرتكب أخطاء؟

وردت الشركة أنها كانت شديدة الحرص علي ضمان الأمن والسلامة. واستشهدت بأنها في البداية كانت تخطط لبدء طرح وضع الصوت المتقدم في يونيو. لكنها اضطرت الي التأجيل لاختبار معايير وأدوات السلامة وضمان إمكانية استخدامها من قبل ملايين الأشخاص مع الحفاظ على الردود في الوقت الفعلي.

رد الشركة علي الانتقادات

قالت الشركة «شهر آخر للوصول إلى مستوى الإطلاق» لاختبار سلامة الأداة.

أكدت الشركة إنه في الأشهر الأخيرة قامت بتجريب قدرات الصوت في نموذج AI مع أكثر من 100 مختبِر يسعون لتحديد النقاط الضعيفة المحتملة «الذين يتحدثون بشكل جماعي 45 لغة مختلفة، ويمثلون 29 منطقة جغرافية مختلفة»، وفقًا لبيان صدر يوم الثلاثاء.

وردت الشركة علي انتقادات الجمهور لها بسبب صوت سكارلت جونسون. أن الصوت لم يكن مقصودًا أن يبدو مثل صوت Johansson وتم إنشاؤه بمساعدة ممثل آخر. كما أوقفت الشركة استخدام الصوت «احترامًا» بعد شكوى الممثل. وأكدت أنه لن يتمكن المستخدمون بعد الآن من الوصول إلى الصوت الذي يعتقد الكثيرون (بما في ذلك الممثل نفسه) أنه يشبه صوت Johansson.

يأتي إطلاق وضع الصوت المتقدم في تشات جي بي تي بعد أن أعلنت أوبن إيه آي الأسبوع الماضي أنها كانت تختبر محرك بحث يستخدم تكنولوجيا الذكاء الاصطناعي الخاصة بها. حيث تستمر الشركة في توسيع تطبيقاتها من أدوات الذكاء الاصطناعي الموجهة للمستهلكين. ومن المتوقع أن يشكل محرك البحث الخاص بأوبن إيه آي تهديدًا تنافسيًا كبيرًا. ذلك للسيطرة علي جوجل في مجال البحث عبر الإنترنت.

آلية العمل

لتفعيل هذه الميزة عليك أن تتبع الخطوات التالية:

أولًا: تثبيت تطبيق شات جي بي تي على هاتفك. أو التحديث للنسخة الأخيرة. ثم قم بتسجيل الدخول إلى حساب Open AI الخاص بك.

ثانيًا: يجب تثبيت سماعات الرأس في الزاوية اليمنى السفلية. وبمجرد تشغيل التطبيق. يمكنك البدء بالدردشة الصوتية مع الذكاء الاصطناعي الذي يدعم لغات عدة، من بينها الصينية.

في حالة تشغيل التطبيق للمرة الأولي، سوف يطلب منك اختيار صوت لروبوت الدردشة من بين خمسة خيارات فريدة. لكل منها أصوات ونغمات مختلفة تمامًا.

وقد تزيد ميزة الصوت الجديدة من تفاعل المستخدم، الأمر الذي سيوفر طريقة أكثر طبيعية وبديهية للتعامل مع الذكاء الاصطناعي.

بالتالي يتم توفير هذه الميزة لمجموعة واسعة من المستخدمين. بمن في ذلك أولئك الذين قد يفضلون الأوامر الصوتية على الكتابة. إضافة إلى إمكانية استخدام تقنية الذكاء الاصطناعي من دون تكبد أي عناء.

استخدام ميزة الصوت الحي لتطوير المحتوي 

وقد تكون هذه الميزة الجديدة مفيدةً بشكل خاص أيضًا لتطوير المحتوى. كما تعزز تجربة العملاء ومشاركتهم. ايضا تفتح طرقاً جديدة لاستكشاف قدرات الذكاء الاصطناعي.

جدير بالذكر أيضا أنه بمجرد تشغيل الوضع الصوتي الجديد، يتحولChatGPT افتراضياً إلى هذا الشخص الذي يمكنك التحدث إليه من دون استخدام اليدين تمامًا. حيث يتميز بواجهة مختلفة تمامًا عن نافذة الدردشة القياسية. كما لو كنت تجري مكالمة. ما يعني أنه ليست هناك حاجة للضغط على أي أزرار للتحدث، وسينتظر تطبيقChatGPT دورك بصبر بمجرد انتهاء دوره.

أيضًا يسمح التطبيق للمستخدم  الخروج من التطبيق ومتابعة المحادثة أثناء أداء مهام أخرى على هاتفك. الأمر الذي يمكن أن يغير قواعد اللعبة في الأوقات التي على سبيل المثال تريد أن تقرأ فيها مقالًا في الوقت نفسه.

الرابط المختصر :