مجلة عالم التكنولوجيا
مجلة تكنولوجية شاملة

“فيسبوك” تعتمد أداة ذكاء اصطناعي جديدة لتحويل الصور 2D إلى نماذج 3D

0 2٬967

في كثير من الأحيان نواجه بعض العقبات التي تتعلق بتحويل مصدر صورة ثنائية الأبعاد 2D إلى نموذج ثلاثي الأبعاد 3D، خاصة فيما يتعلق بالتعارض بين الدقة وسعة الذاكرة، في حين أننا نحتاج إلى كمية مستدامة من تدفق البيانات للحفاظ على عمل أجهزتنا على قدر عالٍ من الوضوح والسرعة العالية.

وتفضل التطبيقات عادةً وحتى وقتنا الراهن في هذا المجال المدخلات منخفضة الدقة؛ لضمان تغطية قدر كبير من الخلفية بشكل عام؛ لذا فإن هذه الدراسة تمنحنا دفعة إلى الأمام نحو أرض وسطية مريحة.

وكان فريق أبحاث فيسبوك تمكن، مؤخرًا، من معالجة هذه المشكلة وذلك من خلال اعتماد نظام تحليل متعدد الطبقات؛ بحيث يأخذ هذا النظام الصورة الأصلية بأكملها ويتم التركيز على المنطق الشامل لها، ثم يتم الانتقال إلى المستوى الثاني الذي يستنبط بيانات الإخراج لاستخدامها كخريطة طريق؛ ليتم جمعها في النهاية بطريقة هندسية أكثر تفصيلًا لتمنحنا صورًا عالية الدقة.

ولا يُعد هذا البحث الهدف الوحيد في هذا المجال، فالتكنولوجيا البشرية تسعى جاهدة إلى فتح الباب أمام العديد من الاحتمالات لمجموعة متنوعة من المجالات الأخرى، مثل تحويل التصوير الطبي إلى واقع افتراضي يقدم صورًا تعبيرية مخصصة ثلاثية الأبعاد. 

وعلى الرغم من أن هذه التقنيات محدودة وتقتصر على بعض الأشخاص دون غيرهم؛ بسبب بعض القيود مثل الحاجة إلى كاميرات متعددة ومتطلبات إضاءة صارمة، إلا أن فريق البحث في فيسبوك يسعى إلى تحقيق نظام عرض عالي المرونة يمكنه الحفاظ على الدقة العالية عندما يتعلق الأمر بتفاصيل، مثل الثنيات في الملابس والأصابع والفروق الدقيقة في ملامح الوجه.

التكنولوجيا الموجودة سابقًا

سبق واستخدمت جامعة “ستانفورد” في عام 2005 بمشروع SCAPE  شبكات مسبقة التصميم على مدخلات الصور لإنتاج عروض ثلاثية الأبعاد، إلا أن المشروع لم يتمكن من إعطاء النتائج التي كان فريق العمل يتطلع إليها، ورغم ذلك، لم يتم فرض الهندسة الثلاثية الأبعاد على الصور في هذا المشروع، وتم تطبيق سياق هندسي على مستويات أعلى بدلًا من ذلك دون إجراء افتراضات سابقة لأوانها، أو بالأحرى، تم تنفيذ التفاصيل المفقودة بشكل تدريجي من المدخلات الخشنة إلى التحليل التفصيلي، ومن ثم تم تحديد الخصائص الهندسية للنموذج في المستوى النهائي فقط.

الجانب الخلفي

أما عن الخلفية فإنها تبقى في إعادة بناء الصورة الواحدة دون أن يتم ملاحظتها، وبالتأكيد فإن المعلومات المفقودة تعني عدم وضوح تقديرات الخلفية.

وتغلب فريق أبحاث فيسبوك بالفعل على هذه المشكلة من خلال تحديد المعايير الطبيعية في الخلفية على حد تعبيرهم؛ حيث قالوا: “تغلبنا على تلك المشكلة من خلال الاستفادة من شبكات الترجمة من صورة إلى صورة لإنتاج المعايير الطبيعية في الخلفية، وتكييف استدلال الشكل المحاذي للبكسل متعدد المستويات مع الاستدلال بالخلفية، وإزالة السطح العادي الذي يحسن وبشكل ملحوظ الجودة الإدراكية لعمليات إعادة البناء لدينا بمستوى أكثر اتساقًا من التفاصيل”.

المصدر:

Interestingengineering: Facebook’s New AI Tool Transforms 2D Image to 3D Models

الرابط المختصر :

اترك رد

لن يتم نشر عنوان بريدك الإلكتروني.