تتحدى Google منشئ ChatGPT للحصول على تاج إنشاء الفيديو بالذكاء الاصطناعي

معركة الذكاء الاصطناعي بين جوجل ويشهد OpenAI (الفريق الذي يقف وراء ChatGPT) نشاطًا متزايدًا، حيث تطرح الشركتان منتجات وميزات وتحديثات جديدة هذا الشهر. والآن، يضع Google DeepMind، وهو مختبر أبحاث الذكاء الاصطناعي التابع لشركة Google، نصب عينيه التغلب على OpenAI في لعبة توليد الفيديو – وقد ينجح في ذلك، على الأقل لفترة من الوقت.

جوجل تواجه Sora من OpenAI مع Veo 2

كشفت DeepMind النقاب عن Veo 2، الجيل التالي من الذكاء الاصطناعي لإنشاء الفيديو وخليفة Veo، الذي يشغل العديد من المنتجات في مجموعة Google. يمكن لـ Veo 2 إنتاج مقاطع أطول من دقيقتين، بدقة تصل إلى 4K (4096 × 2160 بكسل). وهذا يعادل أربعة أضعاف الدقة وأكثر من ستة أضعاف المدة OpenAI's Sora، والذي تم إتاحته للمستخدمين مؤخرًا.
ومع ذلك، فإن هذه الميزة لا تزال نظرية. في أداة الفيديو التجريبية من Google، VideoFX، حيث يكون Veo 2 حصريًا حاليًا، تقتصر مقاطع الفيديو على 720 بكسل وطولها ثماني ثوانٍ فقط. (من ناحية أخرى، يستطيع Sora إنشاء مقاطع فيديو مدتها 20 ثانية بدقة 1080 بكسل.)

VideoFX موجود حاليًا في قائمة الانتظار، لكن Google تعمل على زيادة عدد المستخدمين الذين يمكنهم الوصول إليه هذا الأسبوع. وتخطط الشركة لطرحها على المزيد من منتجاتها، بما في ذلك YouTube Shorts، في وقت ما من العام المقبل. يشبه إلى حد كبير برنامج Veo الأصلي، حيث يمكن لـ Veo 2 إنشاء مقاطع فيديو من مطالبة نصية بسيطة أو مجموعة من النص وصورة مرجعية.

فيديو قصير تم إنشاؤه باستخدام Veo 2. | رصيد الفيديو – جوجل

إذًا، ما هو المختلف مع Veo 2؟ حسنًا، تقول DeepMind أن هذا النموذج الجديد يأتي مع “فهم” أفضل للفيزياء وأدوات التحكم في الكاميرا، مما يؤدي إلى لقطات “أكثر وضوحًا”. تعني كلمة “أكثر وضوحًا” أنسجة وصورًا أكثر وضوحًا، خاصة في المشاهد المليئة بالإثارة.
عندما يتعلق الأمر بعناصر التحكم في الكاميرا، يمكن لـ Veo 2 الآن وضع الكاميرا الافتراضية بشكل أكثر دقة وتحريكها لالتقاط الأشخاص والأشياء من زوايا مختلفة. ويمكنه أيضًا محاكاة عدسات مختلفة وتأثيرات سينمائية، مما يمنح مقاطع الفيديو مظهرًا أكثر مصقولًا يشبه الأفلام. . بالإضافة إلى ذلك، يُقال إنها تلتقط تعبيرات بشرية أكثر دقة. شاركت DeepMind بعض العينات المختارة بعناية، وأعتقد أنها تبدو مثيرة للإعجاب بالنسبة للقطات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

رصيد الفيديو – جوجل

ومع ذلك، لا يزال هناك بعض العمل الذي يتعين القيام به. ألقِ نظرة على الطريق الأملس الغريب في اللقطات أعلاه أو المشاة في الخلفية وهم يندمجون معًا. لذا، بالنسبة لأي شخص يشعر بالقلق من أن الذكاء الاصطناعي قد يتولى زمام الأمور، فقد قطع خطوات كبيرة، لكنه لا يزال بعيدًا عن استبدال المعرفة والمهارات البشرية.تم تدريب Veo 2 على عدد كبير من مقاطع الفيديو، وهو أمر قياسي جدًا لنماذج الذكاء الاصطناعي. ومن خلال تغذية هذه النماذج بأمثلة لا حصر لها من البيانات، تبدأ في التعرف على الأنماط التي تمكنها من إنشاء محتوى جديد. في حين أن DeepMind لا تكشف عن المصادر الدقيقة لمقاطع الفيديو المستخدمة لتدريب Veo 2، فإن YouTube هو المرشح المحتمل، نظرًا لأن Google تمتلكه.

مثل نماذج الصور والفيديو الأخرى من Google، يقوم Veo 2 بتضمين علامة مائية غير مرئية SynthID في مخرجاته لوضع علامة عليها على أنها تم إنشاؤها بواسطة الذكاء الاصطناعي، وهو ما يهدف إلى المساعدة في منع المعلومات الخاطئة والإسناد الخاطئ. ولكن لنكن واقعيين، ربما لا يتحقق معظم الأشخاص من هذه العلامة المائية قبل مشاركة مقطع فيديو، مما يترك مجالًا لانتشار المعلومات الخاطئة.

جنبا إلى جنب مع Veo 2، كشفت Google DeepMind أيضًا عن ترقيات لـ Imagen 3، نموذج توليد الصور الخاص بها. يتوفر الآن إصدار جديد من Imagen 3 لمستخدمي ImageFX، أداة إنشاء الصور من Google، بدءًا من يوم الاثنين. يعد النموذج المحدث بتقديم صور وصور “أكثر سطوعًا وأفضل تكوينًا” بأنماط مختلفة، بما في ذلك الصور الواقعية والانطباعية والأنمي.

مصدر الخبر
نشر الخبر اول مرة على موقع :www.phonearena.com
بتاريخ:2024-12-17 12:51:00
الكاتب:Tsveta Ermenkova
ادارة الموقع لا تتبنى وجهة نظر الكاتب او الخبر المنشور بل يقع على عاتق الناشر الاصلي

JOIN US AND FOLO

Telegram

Whatsapp channel

Nabd

Twitter

GOOGLE NEWS

tiktok

Facebook

/a>

Exit mobile version