تطبيقChatGPT يرى ويسمع.. قفزة نوعية في الذكاء الاصطناعي

أحدثت شركة OpenAI نقلة نوعية في عالم الذكاء الاصطناعي بإطلاقها ميزة جديدة لروبوت الدردشة الشهير ChatGPT، وهي ميزة “وضع الصوت المتقدم مع الرؤية”.

فيما هذه الميزة تطبيق ChatGPT القدرة على فهم وفك شفرة العالم المرئي؛ ما يوسع آفاق تطبيقاته بشكل كبير.

تحديثات جديدة في ChatGPT

يمكن لتطبيق ChatGPT الآن أن يتابع مقاطع الفيديو ويستخلص المعلومات منها في الوقت الحقيقي. هذا يعني أنه يمكنه وصف ما يحدث في الفيديو، وتحديد الأجسام والأشخاص، وحتى فهم السياق العام للمقطع.

 بالإضافة إلى الفيديو يمكن لـ ChatGPT تحليل الصور بدقة عالية. كما يستطيع وصف محتويات الصورة، وتحديد الألوان والأشكال، وحتى تفسير المعنى الكامن وراءها.

 وقالت  شركة OpenAI إن طرح وضع الصوت المتقدم مع الرؤية سيبدأ يوم الخميس، وينتهي في الأسبوع المقبل. ولكن لن يحصل جميع المستخدمين على الوصول. فمشتركو ChatGPT Enterprise وEdu لن يحصلوا على الميزة حتى يناير،

في حين أضافت أنها لا تملك جدولًا زمنيًا لمستخدمي ChatGPT في الاتحاد الأوروبي أو سويسرا أو آيسلندا أو النرويج أو ليختنشتاين.

في بث مباشر مفاجئ تحول كيفن ويل وفريق OpenAI إلى باريستا محترفين بمساعدة ChatGPT. حيث  استخدموا الذكاء الاصطناعي لتوجيه عملية تحضير القهوة خطوة بخطوة. وكأنهم يتبعون وصفة سحرية.

ولم يقتصر الأمر على تحضير القهوة. بل امتد إلى التعرف على لحية سانتا التي يرتديها ويل في صورة على الهاتف. ما أضفى لمسة من المرح على العرض.

الآثار المتوقعة من تحديثات ChatGPT

بينما تؤدي هذه الميزة إلى تحسين تجربة المستخدم بشكل كبير. إذ يمكن للمستخدمين الآن طرح أسئلة على ChatGPT حول مقاطع الفيديو والصور، والحصول على إجابات مفصلة وشاملة.

علاوة على ذلك تفتح هذه الميزة الباب أمام تطبيقات جديدة عديدة. حيث يمكن للمستخدمين البحث عن صور وفيديوهات باستخدام وصف نصي.

فيما يمكن لـ ChatGPT توليد وصف تفصيلي لصور وفيديوهات، أو حتى كتابة قصص بناءً على محتواها المرئي.

المصدر

الرابط المختصر :