
أعلنت غوغل خلال مؤتمر I/O 2025 عن العديد من التقنيات الحديثة، من بينها نموذج Veo 3 الذي يستخدم الذكاء الاصطناعي لصنع الفيديوهات.
وأشارت غوغل خلال المؤتمر إلى أن نموذج Veo 3 الجديد جاء أكثر تطورا بكثير مقارنة بنموذج Veo2، فهو لا ينشئ مقاطع الصور فحسب، بل يدعم هذه المقاطع بمؤثرات صوتية مميزة.
يمكن لخوارزميات هذا النموذج إنشاء مؤثرات صوتية وضوضاء خلفية وحتى حوارات ومزامنتها مع الصور، وما يميزه هو قدرته على تحليل الصور بشكل دقيق ومزامنتها مع الأصوات للحصول على مقاطع فيديو عالية الجودة.
لم تعلن غوغل عن المصادر التي استخدمتها في تدريب Veo 3، لكن التسريبات تشير إلى أنها اعتمدت على فيديوهات يوتيوب، وخاصة أن قسم DeepMind التابع لغوغل كان قد أشار سابقا إلى احتمالية الاستفادة من محتوى يوتيوب لتدريب الذكاء الاصطناعي.
ولمواجهة تقنيات “التزييف العميق” ستحصل مقاطع الفيديو المولدة بنموذج Veo 3 على علامات مائية خاصة، إذ تستخدم غوغل تقنية SynthID التي تدمج علامات غير مرئية في كل إطار من إطارات الفيديو، وبالتالي سيكون بالإمكان معرفة أن المقطع تم توليده بالذكاء الاصطناعي.
يتوفر النموذج الجديد ضمن تطبيق Gemini لمستخدمي باقات ” AI Ultra” التي تكلّف اشتراكاتها 250 دولارا شهريا.