Stable Diffusion.. أنتج صوراً رائعة باستخدام الذكاء الاصطناعي (فيديو)

المحتوي

أداة ذكاء اصطناعي توليدية تستطيع إنتاج صور من أوامر النص والصورة، حيث يمكنك استخدامها لإنشاء صور، ومقاطع فيديو ورسوم متحركة.

وتعتمد الأداة على تقنية الانتشار وتستخدم المساحة الكامنة (latent space). لتقلل بشكل كبير من متطلبات المعالجة.

وأوضح القائمون على الأداة أنه يمكن تشغيلها على أجهزة الكمبيوتر المكتبية أو المحمولة المزودة بوحدات معالجة الرسومات (GPU). كما يمكن ضبط Stable Diffusion بدقة لتلبية احتياجاتك الخاصة بأقل من خمس صور من خلال التعلم الانتقالي.

مميزات الأداة

تعتبر أداة Stable Diffusion سهل الوصول إليها ويسهل استخدامها.

كما يمكن تشغيلها على بطاقات رسومات من فئة المستهلكن ويمكن لأي شخص تنزيل النموذج وإنشاء صوره. وتتيح الأداة التحكم في المعلمات التشعبية الرئيسية، مثل عدد خطوات تقليل الضوضاء ودرجة الضوضاء المطبقة.

وتختلف Stable Diffusion عن العديد من أدوات إنشاء الصور الأخرى. من حيث المبدأ، تستخدم نماذج الانتشار الضوضاء الغاوسية (Gaussian) لترميز الصورة.

إمكانات Stable Diffusion

تعتبر أداة Stable Diffusion فريدة من نوعها، فهي لا يستخدم مساحة البكسل للصورة. بدلاً من ذلك، تستخدم مساحة كامنة ذات تعريف مخفض.

والسبب في ذلك هو أن الصورة الملونة بدقة 512×512 تحتوي على 786,432 قيمة محتملة.

على جانب أخر تستخدم Stable Diffusion صورة مضغوطة أصغر بـ 48 مرة عند 16,384 قيمة. الأمر الذي يقلل بشكل كبير من متطلبات المراجعة.

كما تستخدم أداة Stable Diffusion ملفات التشفير التلقائي المتغيرة (VAE) في وحدة فك الترميز لرسم تفاصيل دقيقة مثل العيون.

تم تدريب Stable Diffusion V1 باستخدام ثلاث مجموعات بيانات جمعتها LAION من خلال الزحف المشترك (Common Crawl). يتضمن ذلك مجموعة بيانات LAION-Aesthetics v2.6 للصور ذات التصنيف الجمالي 6 أو أعلى.

الرابط المختصر :