«Microsoft AI» تطلق ثلاثة نماذج أساسية لتوليد النصوص والصوت والصور

أعلنت Microsoft إطلاق ثلاثة نماذج أساسية جديدة للذكاء الاصطناعي قادرة على توليد النصوص والصوت والصور.

وذلك في خطوة تعكس استمرار العملاق التقني في بناء مجموعة متكاملة من النماذج متعددة الوسائط. على الرغم من شراكته المستمرة مع OpenAI.

في حين تضم المجموعة الجديدة:

  • MAI-Transcribe-1: نموذج لتحويل الكلام إلى نص في 25 لغة مختلفة. أسرع بمقدار 2.5 مرة من خدمة Azure Fast الحالية.
  • MAI-Voice-1: نموذج صوتي يولد دقيقة واحدة من الصوت في ثانية واحدة. ويتيح إنشاء أصوات مخصصة للمستخدمين.
  • MAI-Image-2: نموذج لتوليد الفيديوهات، كان أُطلق أول مرة على منصة MAI Playground في 19 مارس. والآن أصبح متاحًا على Microsoft Foundry، إلى جانب نماذج النسخ الصوتي والصوتي المتاحة أيضًا على MAI Playground.

شركة مايكروسوفت

يذكر أن هذه النماذج طورها فريق MAI Superintelligence. بقيادة مصطفى سليمان؛ الرئيس التنفيذي لـ Microsoft AI. الذي أعلن تشكيل الفريق في نوفمبر 2025. وفقًا لـ”تك كرانش”.

بينما قال سليمان في تدوينة: “في Microsoft AI، نبني ذكاءً اصطناعيًا إنسانيًا. نحن نركز على الإنسان عند تصميم نماذجنا. ونهدف إلى تحسين طرق التواصل الفعلية، وتدريب النماذج للاستخدام العملي”.

كما أضاف: “سوف تشهدون قريبًا المزيد من النماذج على Foundry ومباشرة ضمن منتجات Microsoft”.

كذلك أشارت الشركة إلى أن هذه النماذج تتميز بتكلفتها الأقل مقارنة بمنافسيها من Google وOpenAI.

ورغم إطلاق هذه النماذج أكّد سليمان استمرار التزام Microsoft بشراكتها مع OpenAI، مع الإشارة إلى أن إعادة التفاوض الأخيرة على الشراكة أتاحت لشركة مايكروسوفت التوسع بشكل أكبر في أبحاث الذكاء الفائق.

يذكر أن Microsoft استثمرت أكثر من 13 مليار دولار في مختبر أبحاث الذكاء الاصطناعي الخاص بها.

في حين تستضيف نماذجها عبر منتجاتها المتعددة ضمن شراكات طويلة الأمد، مع الاعتماد على مزيج من شرائح الإنتاج الداخلي وشراء الأجهزة من مزودين خارجيين.

الرابط المختصر :