بانفعالات وأصوات.. “مايكروسوفت” تبتكر أداة قادرة على تحريك الصور الثابتة
الترند العربي – متابعات
أنشأت شركة مايكروسوفت أداة جديدة تعمل بواسطة الذكاء الاصطناعي، تجعل الحدود بين ما هو حقيقي وغير حقيقي أقل من أي وقت مضى.
تعمل هذه التقنية، التي يطلق عليها VASA-1، على تحويل الصورة الثابتة لوجه الشخص، إلى مقطع متحرك له وهو يتحدث أو يغني، وتزعم شركة التكنولوجيا العملاقة أن حركات الشفاه متزامنة بشكل رائع مع الصوت لجعل الأمر يبدو وكأنه واقعيا.
تلتقط الأداة صورة ثابتة للوجه، سواء كانت صورة لشخص حقيقي أو عمل فني أو رسم لشخص خيالي، ثم تطابق بعد ذلك الصورة مع صوت لإضفاء الحيوية على الوجه، بينما تحرك الوجه بما يتناسب مع هذا الصوت، بحسب ما ذكره تقرير نشرته صحيفة «ديلي ميل» البريطانية.
وأوضحت مايكروسوفت أنه تم تدريب الأداة باستخدام مكتبة من تعبيرات الوجه، والتي تتيح له أيضًا تحريك الصورة الثابتة لتتزامن مع حركات الصوت ومشاعره.
في منشور بالمدونة، وصف باحثو مايكروسوفت الأداة بأنها «إطار عمل لإنشاء وجوه ناطقة واقعية لشخصيات افتراضية»، ويقولون: «إنه يمهد الطريق لتفاعلات في الوقت الفعلي مع صور رمزية نابضة بالحياة تحاكي سلوكيات المحادثة البشرية، طريقتنا ليست قادرة على إنتاج تزامن دقيق بين الشفاه والصوت فحسب، بل يمكنها أيضًا التقاط مجموعة كبيرة من المشاعر والفروق الدقيقة المعبرة في الوجه وحركات الرأس الطبيعية التي تساهم في إدراك الواقعية والحيوية».
فيما يتعلق بحالات الاستخدام، يعتقد الفريق أن VASA-1 يمكن أن يمكّن الصور الرمزية الرقمية للذكاء الاصطناعي من التفاعل بطرق طبيعية وبديهية مثل التفاعلات مع البشر الحقيقيين.
لكن الخبراء عبروا عن مخاوفهم بشأن هذه التكنولوجيا، والتي إذا تم إطلاقها قد تجعل الناس يبدون وكأنهم يقولون أشياء لم يقولوها أبدًا.
هناك خطر محتمل آخر وهو الاحتيال، حيث يمكن خداع الأشخاص عبر الإنترنت من خلال رسالة مزيفة من صورة شخص يثقون به.
وقال جيك مور، المتخصص الأمني في شركة ESET: «الرؤية لم تعد تصدق بعد الآن. فمع تحسن هذه التكنولوجيا، أصبح هناك سباق مع الزمن للتأكد من أن الجميع يدركون تمامًا ما هو صحيح، وأنه يجب عليهم التفكير مرتين قبل قبول المراسلات على أنها حقيقية».
حذر الخبراء من أنها قد تقضي على صناعات بأكملها مثل إنتاج الأفلام وتؤدي إلى ارتفاع مقاطع الفيديو المزيفة العميقة التي تسبق الانتخابات الرئاسية الأمريكية.
وفقاً للباحثين في الجامعة الوطنية الأسترالية، فإن الوجوه المزيفة التي يصنعها الذكاء الاصطناعي تبدو أكثر واقعية من الوجوه البشرية، وحذر هؤلاء الخبراء من أن تصوير الذكاء الاصطناعي للأشخاص يميل إلى «الواقعية المفرطة»، مع وجوه أكثر تناسبًا، ويخطئ الناس في ذلك باعتباره علامة على الإنسانية.
وقال الدكتور أندرو روجويسكي من جامعة سري البريطانية: «إن فكرة أن الذكاء الاصطناعي يمكنه إنشاء مقطع فيديو شديد الواقعية، على سبيل المثال، لسياسي يفعل شيئًا غير مرغوب فيه، يجب أن تدق أجراس الإنذار مع دخولنا في العام الأكثر ازدحامًا بالانتخابات في تاريخ البشرية».