تطوير كاميرا ذكية تنفذ الأوامر الصوتية بواسطة التتبع
أستمع الي المقال
عالم التكنولوجيا ترجمة
بقدر ما يكون من المريح أن تطلب من Siri تنفيذ أمر ما بالمنزل أو تحميل الأغاني المفضلة لديك دون استخدام هاتفك فهناك أوقات لا يكون فيها التفاعل اللفظي مع المساعدين الأذكياء خيارًا؛ لذلك طوّر الباحثون في جامعة كورنيل كاميرا ذكية يمكن ارتداؤها يمكنها اكتشاف الأوامر الصوتية حتى عندما لا يغمغم المستخدم بالأوامر الصوتية.
يستمر تحسن ذكاء المساعدين الذين يتم تنشيطهم بالصوت وقدرتهم على فهم الأوامر الصوتية دون عناء عامًا بعد عام، ولكن الشيء الوحيد الذي كانوا جيدين فيه منذ البداية هو فهم الأوامر البسيطة. كما يُعد أحد أفضل الأسباب لاختيار سماعات الأذن اللاسلكية من Apple وGoogle وAmazon هو سهولة الوصول إلى المساعدين الأذكياء من خلال الكلمات المشغلة.
لكن في تلك الأوقات التي لا تريد فيها إصدار الأوامر بصوت عالٍ فإن الكاميرا الذكية SpeeChin هي بديل مثير للاهتمام.
– مواصفات الكاميرا الذكية SpeeChin
تم تصميم SpeeChin بواسطة “تشنغ تشانغ”؛ الأستاذ المساعد في علوم المعلومات بكلية الحوسبة وعلوم المعلومات في جامعة كورنيل، و”روي تشانغ تشانغ”؛ طالب الدكتوراه بجامعة كورنيل.
إنها كاميرا صغيرة تعمل بالأشعة تحت الحمراء معلقة بقلادة يتم ارتداؤها على مستوى الصدر. وتشير الكاميرا لأعلى فتلتقط فيديو عالي التباين لحركات ذقن مرتديها، والتي يمكن بعد بعض التدريب استخدامها لمعرفة ما يقوله شخص ما دون إصدار أي صوت.
موقع الكاميرا ليس فقط أكثر سرية من تركيب الكاميرا على وجه شخص ما لتسجيل حركات فمه، بل إنه يقع أيضًا في زاوية حيث لا يمكن التقاط وجوه الآخرين؛ ما يضمن عدم وجود مخاوف تتعلق بالخصوصية.
وقد قام الباحثون باختبار الكاميرا الذكية SpeeChin مع 20 مشاركًا، تحدث 10 منهم 54 عبارة بسيطة بما في ذلك الأرقام وأوامر المساعد الصوتي الشائعة باللغة الإنجليزية، وتحدث 10 منهم 44 كلمة وعبارة بسيطة بلغة الماندرين الصينية. وبعد فترة تدريب تمكنت الكاميرا الذكية من التعرف على الأوامر باللغة الإنجليزية بدقة 90.5%، والأوامر بلغة الماندرين الصينية بدقة 91.6%.
لكن عندما طُلب من الباحثين نطق هذه العبارات أثناء المشي انخفضت الدقة نتيجة للاختلافات في حركات كل شخص بما في ذلك طريقة مشيه والحركة الإضافية لرأسه. إنها مشكلة يمكن حلها من خلال جلسة تدريب أطول تتضمن الوقوف والمشي أثناء العمل، بالإضافة إلى معدات الكاميرا المحسّنة القادرة بشكل أفضل على تتبع حركات الذقن.
أخيرًا نتمنى أن يستمر الباحثون في تطوير التكنولوجيا؛ لأنه مع المزيد من قدرات التعرف على الكلام المتقدمة سيكون العالم مكانًا أكثر هدوءًا؛ حيث لا يضطر أحد إلى إصدار صوت.
اقرأ أيضًا:
Sony تبتكر مستشعر كاميرا بنطاق ديناميكي أوسع وتشويش أقل