Google के नए ‘Veo 2’ AI टूल की मदद से बनाए शानदार वीडियो, ये है तरीका?
इंटरनेट की दुनिया में मानों वर्चस्व रखने वाली गूगल ने अपने आर्टिफिशियल इंटेलिजेंस (AI) प्लेटफॉर्म को और भी उन्नत करते हुए दो नए टूल्स Veo 2 (AI Tool For Video Making) और Imagen 3 को पेश किया है। ये टूल्स वीडियो और इमेज जनरेशन के क्षेत्र में तकनीकी क्रांति लाने का दावा करते हैं। इन टूल्स को गूगल लैब्स के VideoFX, ImageFX और Whisk जैसे प्लेटफॉर्म्स के जरिए उपयोग में लाया जा सकता है। Veo 2 एक अत्याधुनिक वीडियो जनरेशन मॉडल है, जो हाई-क्वालिटी और रियल-लाइफ वीडियो बनाने में सक्षम है। गूगल का दावा है कि यह मॉडल 4K तक के उच्च रिज़ॉल्यूशन में वीडियो तैयार कर सकता है और इसमें विविध कैमरा एंगल्स, शॉट्स और मूवमेंट्स को बड़ी सटीकता के साथ शामिल किया जा सकता है।
Veo 2: Free AI Video Making Tool?
एआई वीडियो मेकिंग टूल, Veo 2 वास्तविक दुनिया के भौतिक विज्ञान और मानव गतियों की गहरी समझ रखता है, जो इसे अधिक यथार्थवादी और डिटेल्ड वीडियो जनरेट करने में सक्षम बनाता है। यह मॉडल सिनेमेटोग्राफी की भाषा को बखूबी समझता है। उपयोगकर्ता इसके जरिए विभिन्न सिनेमाई इफेक्ट्स जैसे टाइम-लैप्स, एरियल शॉट्स, और लो-एंगल ट्रैकिंग शॉट्स आसानी से तैयार कर सकते हैं। Veo 2 उपयोगकर्ताओं को कैमरा एंगल्स और लेंस के प्रभावों को कंट्रोल करने की आजादी देता है। उदाहरण के तौर पर, अगर आप ’18mm लेंस’ चाहते हैं तो यह मॉडल वाइड-एंगल शॉट तैयार करता है। इसी तरह, ‘शैलो डेप्थ ऑफ फील्ड’ का सुझाव देने पर यह मॉडल बैकग्राउंड को ब्लर करते हुए सब्जेक्ट पर फोकस करता है।
Veo 2: प्रॉम्प्ट पर आधारित AI वीडियो
नए Veo 2 की सबसे बड़ी खासियत यह है कि यह टेक्स्ट और इमेज दोनों के संयोजन पर काम कर सकता है। आप केवल टेक्स्ट प्रॉम्प्ट या एक इमेज अपलोड कर सकते हैं, और यह दोनों को समझते हुए एक यथार्थपूर्ण वीडियो तैयार करता है। Veo 2 में गूगल ने SynthID वॉटरमार्क का उपयोग किया है, जो वीडियो को एआई-जनरेटेड के रूप में पहचानने में मदद करता है। इससे गलत सूचना और गलत उपयोग की संभावना को कम किया जा सकता है। गूगल ने यह भी बताया कि Veo 2 को धीरे-धीरे YouTube Shorts और अन्य प्लेटफॉर्म्स पर उपलब्ध कराया जाएगा।
Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥
We’re also releasing an improved version of our text-to-image model, Imagen 3 – available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
— Google DeepMind (@GoogleDeepMind) 16 दिसंबर 2024
Imagen 3: एआई इमेज जनरेशन टूल
Veo 2 के अलावा गूगल ने AI इमेज जनरेशन के लिए भी एक खास टूल लॉन्च किया है। Imagen 3 गूगल का लेटेस्ट इमेज जनरेशन मॉडल है, जो अधिक रियल-लाइफ और बेहतर ढंग से कम्पोज़्ड इमेज तैयार करता है। यह मॉडल न केवल फोटो-रियलिज्म बल्कि एब्सट्रैक्ट, एनीमे और इम्प्रेशनिज़्म जैसे विभिन्न आर्ट स्टाइल्स को भी सपोर्ट करता है। Imagen 3 पिछले मॉडलों की तुलना में अधिक समृद्ध डिटेल्स और टेक्सचर उत्पन्न करता है। यह प्रॉम्प्ट को पहले से अधिक सटीकता के साथ समझता है और उसकी अनुरूप इमेज तैयार करता है। गूगल का दावा है कि मानव रेटर्स द्वारा की गई तुलना में यह मॉडल अन्य अग्रणी इमेज जनरेशन टूल्स से बेहतर साबित हुआ है।
ये भी पढ़ें – लिव-इन-रिलेशनशिप गलत है, इससे समाज खत्म हो जाएगा – नितिन गडकरी
Imagen 3 को अब ImageFX प्लेटफॉर्म के जरिए 100 से अधिक देशों में उपयोगकर्ताओं के लिए उपलब्ध कराया जा रहा है। यह उपयोगकर्ताओं को फोटोरियलिस्टिक और रचनात्मक इमेज बनाने का मौका देता है। Veo 2 और Imagen 3 गूगल की एआई तकनीक में हो रहे निरंतर सुधार का प्रमाण हैं। ये टूल्स न केवल क्रीएटर इंडस्ट्री बल्कि एंटरप्राइज ग्राहकों के लिए भी उपयोगी साबित हो सकते हैं। YouTube क्रिएटर्स, फिल्म निर्माता और डिज़ाइनर्स के लिए ये टूल्स नई संभावनाओं के दरवाजे खोलते हैं।
Whisk टूल क्या है?
गूगल ने Whisk नामक एक नया टूल भी लॉन्च किया है, जो Imagen 3 और Gemini मॉडल को मिलाकर काम करता है। Whisk उपयोगकर्ताओं को अपनी इमेज और प्रॉम्प्ट को मिलाकर कुछ अनोखा बनाने की सुविधा देता है। Whisk में उपयोगकर्ता अपनी इमेज अपलोड कर सकते हैं। इसके बाद Gemini मॉडल इमेज का विस्तृत विवरण तैयार करता है और इसे Imagen 3 में भेजता है। इस प्रक्रिया के जरिए उपयोगकर्ता अपनी रचनात्मकता को नया आयाम दे सकते हैं, जैसे डिजिटल प्लशीज, स्टिकर्स या अन्य कस्टम डिज़ाइन्स आदि।