تقنية صينية تحدث قفزة غير مسبوقة في توليد فيديوهات الذكاء الاصطناعي

ثورة الذكاء الاصطناعي

كشف باحثون صينيون عن تقنية جديدة قد تحدث تحولًا جذريًا في عالم إنتاج الفيديو بالذكاء الاصطناعي، عبر تسريع عملية التوليد إلى مستويات غير مسبوقة تقترب من الزمن الحقيقي، في خطوة من شأنها إعادة رسم ملامح صناعة المحتوى الرقمي عالميًا.

تسريع توليد فيديوهات الذكاء الاصطناعي

وبحسب ورقة بحثية نشرت مؤخرًا، تحمل التقنية الجديدة اسم TurboDiffusion. وتتيح تسريع توليد فيديوهات الذكاء الاصطناعي بما يصل إلى 200 ضعف، دون التأثير على جودة الصورة. ما يفتح الباب أمام استخدامات تجارية وتفاعلية واسعة النطاق.

ووفقًا للباحثين من جامعة تسينغهوا في بكين، وبالتعاون مع شركة Shengshu المطورة لنماذج الذكاء الاصطناعي، وجامعة كاليفورنيا بيركلي. نجحت التقنية في تقليص زمن إنشاء مقطع فيديو مدته خمس ثوانٍ وبدقة عادية من أكثر من ثلاث دقائق إلى 1.9 ثانية فقط، عند اختبارها على جهاز استهلاكي مزود ببطاقة Nvidia RTX 5090.

الذكاء الاصطناعي (آيستوك)ِ

أما في حالة الفيديو عالي الدقة، فانخفض زمن التوليد على الجهاز نفسه من قرابة 80 دقيقة إلى 24 ثانية فقط. أي تسريع يقترب من 200 مرة. وذلك وفقًا لأحد الاختبارات الواردة في الدراسة، بحسب تقرير نشره موقع SCMP.

سباق تقني يتسارع

كما يأتي هذا التطور في وقت لا تزال فيه منصات كبرى تعاني من بطء نسبي في توليد الفيديو. إذ يستغرق إنشاء فيديو مدته خمس ثوانٍ على منصة Vidu التابعة لشركة Shengshu ما بين ثلاث إلى خمس دقائق.

في حين أشارت شركة OpenAI سابقًا إلى أن نموذجها الشهير Sora يحتاج عدة دقائق لإنتاج مقاطع قصيرة.

ويرى مراقبون أن TurboDiffusion يعكس التقدم السريع الذي حققه الباحثون الصينيون في مجال توليد الفيديو بالذكاء الاصطناعي.

منذ إعلان OpenAI عن نموذج Sora في فبراير 2024. في إطار سباق تقني عالمي يتسارع بشكل لافت.

وكلاء الذكاء الاصطناعي

نقطة تحول في صناعة المحتوى

ويقول محلل الصناعة كيون شو إن تسريع إنتاج الفيديو يمثل نقطة تحول مهمة، لأن نماذج توليد الفيديو لن تعود عائقًا أمام سلاسل الإنتاج الإبداعي والتجاري. بل تصبح أداة فورية يمكن دمجها بسهولة في workflows اليومية.

ووجه الباحثون هذا الإنجاز إلى ابتكارات في تدريب النماذج، أبرزها استخدام ما يعرف بـالانتباه الخطي المتناثر، وهي تقنية تتيح للنموذج التركيز على الأجزاء الأكثر أهمية من البيانات بدل معالجتها بالكامل. ما يؤدي إلى تقليل زمن المعالجة وخفض كلفة الحوسبة بشكل كبير.

من التوليد إلى التوليد الفوري

وفي تعليق لها، قالت مؤسسة AI Native Foundation، المعنية بتعزيز دمج الذكاء الاصطناعي بشكل عادل وشامل، إن TurboDiffusion تنقل الذكاء الاصطناعي من مرحلة القدرة على التوليد إلى مرحلة التوليد الفوري.

 الأمر الذي يفتح الباب أمام تطبيقات آنية في مختلف القطاعات، من الإعلام والترفيه إلى التعليم والتجارة.

أضافت المؤسسة أن التقنية ستمكن الشركات من إنتاج الفيديو على نطاق تجاري بتكلفة أقل وسرعة أعلى. كما تمثل معيارًا متقدمًا ومفتوح المصدر للباحثين والمطورين الراغبين في بناء تطبيقات تفاعلية وفورية.

مشروع مفتوح المصدر

يذكر أن تقنية TurboDiffusion متاحة بالكامل كمشروع مفتوح المصدر عبر منصة GitHub. ما يعزز فرص انتشارها السريع واعتمادها داخل مجتمع الذكاء الاصطناعي العالمي. ويسرع من وتيرة الابتكار في مجال توليد الفيديو خلال السنوات المقبلة.

الرابط المختصر :