كشفت جوجل عن أحدث إصدار لها من برنامج تحويل النص إلى صورة، Imagen 4، مع وعدٍ بتحسين كبير في عرض النصوص مقارنةً بالإصدار السابق Imagen 3.
ما الجديد في Imagen 4؟
كما طرحت الشركة إصدارًا فاخرًا جديدًا يسمى Imagen 4 Ultra، مُصممًا لمتابعة توجيهات نصية أكثر دقةً إذا كنت ترغب في دفع مبلغ إضافي.
يتوافر كلا الإصدارين كمعاينة مدفوعة في واجهة برمجة تطبيقات Gemini، ولفترة تجريبية مجانية محدودة في Google AI Studio.
تصف جوجل عبر مدونتها طراز Imagen 4 الرئيسي بأنه الخيار الأمثل لمعظم المهام بسعر 0.04 دولار للصورة.
أما Imagen 4 Ultra، فهو مصمم عندما تحتاج إلى أن تتبع صورك التعليمات بدقة. لكن مع وعد بنتائج إخراج قوية مقارنةً بمولدات صور أخرى مثل Dall-E و Midjourney.
وفقًا لجوجل، فهو أسرع من Imagen 3 بالفعل. ويبدو أن إصدارًا جديدًا سيصدر قريبًا سيكون أسرع بعشر مرات. خاصةً عند توليد الصور دفعةً واحدة. ومن بين أهم النقاط البارزة في نموذج الصورة الجديد ما يلي:
- صور واقعية.
- وضوح أكثر حدة.
- تحسين التهجئة والطباعة.
- دعم فوري متعدد اللغات لمساعدة المبدعين على مستوى العالم.
سعر Imagen 4
على أن يرفع هذا الطراز سعره بنسبة 50% ليصل إلى 0.06 دولار للصورة. وأيضًا عرضت الشركة مجموعة من الصور، منها:
رسم هزلي من ثلاثة أجزاء، من إنتاج Imagen 4 Ultra، يظهر سفينة فضاء صغيرة تتعرض لهجوم من سحلية فضائية زرقاء عملاقة. إضافة لبعض المؤثرات الصوتية مثل “Crunch!” و”Had!!” بشكل غير مفهوم.

اتبعت الصورة التعليمات المذكورة من المستخدم وبدت جيدة، تمامًا مثل رسم كاريكاتوري من تطبيق ثلاثي الأبعاد.
نصّ آخر على “واجهة بطاقة بريدية سياحية قديمة إلى كيوتو: معبد شهير تحت أزهار الكرز، وجبال مكللة بالثلوج في الأفق، وسماء زرقاء صافية، وألوان زاهية.

قدمت Imagen 4 هذه المعلومات بدقة، وإن كان بأسلوب عام يفتقر إلى الجاذبية.
أظهرت صورة أخرى زوجين يتنزهان على الأقدام يلوحان من أعلى صخرة، وأخرى جلسة تصوير أزياء “طليعية” مزيفة. كانت الصور عالية الجودة، واتبعت التعليمات النصية بدقة، لكنها بدت وكأنها مولدة آليًا.

Imagen 4 جيد ويبدو أنه يمثل تحسنًا طفيفًا عن ذي قبل، خاصة بالمقارنة مع رواد السوق، Dall-E 3 و Midjourney 7. بالإضافة إلى ذلك، بعد موجة الحماس الأولية، يبدو أن الجمهور قد سئم من فن الذكاء الاصطناعي، ويبدو أن حالة الاستخدام الرئيسية هي الإعلانات المزعجة على وسائل التواصل الاجتماعي أو في أسفل المقالات.



















