أعلنت شركة فيسبوك عن مبادرة جديدة تأمل أن تمنحها ميزة من خلال تدريب الذكاء الاصطناعي على مقاطع الفيديو العامة لمستخدمي المنصة.
ويمثل تعليم أنظمة الذكاء الاصطناعي لفهم ما يحدث في مقاطع الفيديو تمامًا مثل الإنسان أحد أصعب التحديات – وأكبر الاختراقات المحتملة – في عالم التعلم الآلي.
ويعد الوصول إلى بيانات التدريب أحد أكبر المزايا التنافسية في الذكاء الاصطناعي، ومن خلال جمع هذا المورد من الملايين والملايين من المستخدمين، تمكن عمالقة التكنولوجيا من المضي قدمًا في مجالات مختلفة.
وبينما دربت فيسبوك نماذج الرؤية الآلية على مليارات الصور التي تم جمعها من إنستاجرام، فإنها لم تعلن سابقًا عن مشاريع ذات طموح مماثل لفهم الفيديو.
وقالت فيسبوك: من خلال التعلم من مقاطع الفيديو المتاحة للجمهور، التي تغطي كل بلد تقريبًا ومئات اللغات، لن تعمل أنظمة الذكاء الاصطناعي على تحسين الدقة فحسب، بل تتكيف أيضًا مع عالمنا السريع الحركة وتتعرف على الفروق الدقيقة والإشارات المرئية عبر الثقافات والمناطق المختلفة.
ويعتبر المشروع، الذي يحمل عنوان التعلم من مقاطع الفيديو، جزء من جهود فيسبوك الأوسع نحو بناء آلات تتعلم مثل البشر.
وتُستخدم نماذج التعلم الآلي الناتجة لإنشاء أنظمة جديدة للتوصية بالمحتوى وأدوات الإشراف، لكن يمكنها فعل المزيد في المستقبل.
ويمكن للذكاء الاصطناعي الذي يمكنه فهم محتوى مقاطع الفيديو أن يمنح فيسبوك رؤية غير مسبوقة لحياة المستخدمين، مما يسمح لها بتحليل هواياتهم واهتماماتهم وتفضيلاتهم في العلامات التجارية والملابس وتفاصيل شخصية أخرى لا حصر لها.
وتتمتع فيسبوك بإمكانية الوصول إلى مثل هذه المعلومات من خلال عمليتها الحالية لاستهداف الإعلانات، لكن القدرة على تحليل الفيديو من خلال الذكاء الاصطناعي تضيف مصدرًا ثريًا للبيانات إلى إمكانياتها.
وبالرغم من أن المشروع ما يزال في مراحله الأولى، لكنه يؤتي ثماره، وقالت فيسبوك: إنها استغلت هذه التقنية لتحسين توصيات Instagram Reels، مثل: عرض مقاطع فيديو لأشخاص يقومون بالرقص على الموسيقى نفسها.
ويعرض النظام نتائج محسّنة في أخطاء التعرف على الكلام أيضًا، مما قد يعزز ميزات التسمية التوضيحية التلقائية ويسهل اكتشاف الكلام الذي يحض على الكراهية في مقاطع الفيديو.
وتوضح فيسبوك أنها تضع الخصوصية في اعتبارها عندما يتعلق الأمر بالتعلم من مقاطع الفيديو، وكتبت في تدوينة: نحافظ على الأساس القوي للخصوصية الذي يستخدم حلولًا آلية لفرض الخصوصية على نطاق واسع.
وأضافت: من خلال تضمين هذا العمل على مستوى البنية التحتية، يمكننا تطبيق متطلبات الخصوصية باستمرار عبر أنظمتنا ودعم جهود مثل الذكاء الاصطناعي، ويشمل هذا تنفيذ الضمانات التقنية طوال دورة حياة البيانات.
وقد يكون فهم ما يحدث في مقاطع الفيديو مهمة صعبة للغاية لأنظمة الذكاء الاصطناعي، حيث هناك العديد من العقبات، مثل ضوضاء الخلفية التي تجعل من الصعب فهم الكلام.
ومع ذلك، فإن فيسبوك تأخذ ما تعلمه النظام وتضعه في الاستخدام العملي في مجالات أخرى بعد أقل من عام من بدء مشروع التعلم من مقاطع الفيديو.