Veo का इस्तेमाल करके वीडियो जनरेट करना

Gemini API की मदद से, Veo 2 को ऐक्सेस किया जा सकता है. यह Google का सबसे बेहतर वीडियो जनरेट करने वाला मॉडल है. Veo को अगली पीढ़ी के एआई ऐप्लिकेशन बनाने में आपकी मदद करने के लिए डिज़ाइन किया गया है. ये ऐप्लिकेशन, उपयोगकर्ता के प्रॉम्प्ट और इमेज को अच्छी क्वालिटी वाली वीडियो ऐसेट में बदल देते हैं.

इस गाइड से, आपको Gemini API का इस्तेमाल करके Veo का इस्तेमाल शुरू करने में मदद मिलेगी.

Veo के बारे में जानकारी

Veo, Google का अब तक का सबसे बेहतरीन वीडियो जनरेशन मॉडल है. यह कई तरह के सिनेमैटिक और विज़ुअल स्टाइल में वीडियो जनरेट करता है. साथ ही, फ़्रेम में बारीकी से जानकारी देने के लिए, बारीकियों को कैप्चर करता है.

ज़्यादा जानने और आउटपुट का उदाहरण देखने के लिए, Google DeepMind Veo के बारे में खास जानकारी देखें.

विशेषताएं

मोड
  • टेक्स्ट से वीडियो जनरेट करने की सुविधा
  • इमेज से वीडियो जनरेट करने की सुविधा
अनुरोध के पूरा होने में लगने वाला समय
  • कम से कम: 11 सेकंड
  • ज़्यादा से ज़्यादा: 6 मिनट (पीक आवर के दौरान)
वैरिएबल लंबाई जनरेशन 5 से 8 सेकंड
रिज़ॉल्यूशन 720 पिक्सल
फ़्रेम रेट 24fps
आसपेक्ट रेशियो
  • 16:9 - लैंडस्केप
  • 9:16 - पोर्ट्रेट
इनपुट भाषाएं (टेक्स्ट-टू-वीडियो) अंग्रेज़ी

Veo से बनाए गए वीडियो पर, SynthID का इस्तेमाल करके वॉटरमार्क लगाया जाता है. यह एआई से बनाए गए कॉन्टेंट की पहचान करने और उसे वॉटरमार्क करने वाला हमारा टूल है. साथ ही, इन वीडियो को सुरक्षा फ़िल्टर और याद रखने की जांच करने वाली प्रोसेस से भी गुज़ारा जाता है. इससे निजता, कॉपीराइट, और पक्षपात के जोखिमों को कम करने में मदद मिलती है.

शुरू करने से पहले

Gemini API को कॉल करने से पहले, पक्का करें कि आपने अपने पसंदीदा एसडीके टूल को इंस्टॉल कर लिया हो. साथ ही, Gemini API पासकोड को कॉन्फ़िगर कर लिया हो और वह इस्तेमाल के लिए तैयार हो.

Google के जनरल एआई SDK टूल के साथ Veo का इस्तेमाल करने के लिए, पक्का करें कि आपने इनमें से कोई एक वर्शन इंस्टॉल किया हो:

  • Python v1.10.0 या इसके बाद का वर्शन
  • TypeScript और JavaScript के v0.8.0 या इसके बाद के वर्शन
  • Go का 1.0.0 या इसके बाद का वर्शन

वीडियो जनरेट करें

इस सेक्शन में, टेक्स्ट प्रॉम्प्ट और इमेज का इस्तेमाल करके वीडियो जनरेट करने के लिए कोड के उदाहरण दिए गए हैं.

टेक्स्ट से जनरेट करना

Veo की मदद से वीडियो जनरेट करने के लिए, इस कोड का इस्तेमाल किया जा सकता है:

Python

import time
from google import genai
from google.genai import types

client = genai.Client()  # read API key from GOOGLE_API_KEY

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="dont_allow",  # "dont_allow" or "allow_adult"
        aspect_ratio="16:9",  # "16:9" or "9:16"
    ),
)

while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)

for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")  # save the video

REST

# Use curl to send a POST request to the predictLongRunning endpoint
# The request body includes the prompt for video generation
curl "${BASE_URL}/models/veo-2.0-generate-001:predictLongRunning?key=${GOOGLE_API_KEY}" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "Panning wide shot of a calico kitten sleeping in the sunshine"
      }
    ],
    "parameters": {
      "aspectRatio": "16:9",
      "personGeneration": "dont_allow",
    }
  }' | tee result.json | jq .name | sed 's/"//g' > op_name

धूप में सोती हुई बिल्ली का बच्चा.

इस कोड को चलने में करीब दो से तीन मिनट लगते हैं. हालांकि, अगर संसाधनों की कमी है, तो इसमें ज़्यादा समय लग सकता है. प्रोसेस पूरी होने के बाद, आपको ऐसा वीडियो दिखेगा जो कुछ इस तरह का होगा:

अगर आपको वीडियो के बजाय गड़बड़ी का मैसेज दिखता है, तो इसका मतलब है कि संसाधनों की कमी है और आपका अनुरोध पूरा नहीं किया जा सका. ऐसे में, कोड को फिर से चलाएं.

जनरेट किए गए वीडियो, सर्वर पर दो दिन तक सेव रहते हैं. इसके बाद, उन्हें हटा दिया जाता है. जनरेट किए गए वीडियो की लोकल कॉपी सेव करने के लिए, आपको वीडियो जनरेट होने के दो दिनों के अंदर result() और save() चलाने होंगे.

इमेज से जनरेट करें

इमेज का इस्तेमाल करके भी वीडियो जनरेट किए जा सकते हैं. यहां दिया गया कोड, Imagen का इस्तेमाल करके एक इमेज जनरेट करता है. इसके बाद, जनरेट की गई इमेज का इस्तेमाल, जनरेट किए गए वीडियो के शुरुआती फ़्रेम के तौर पर किया जाता है.

सबसे पहले, Imagen का इस्तेमाल करके कोई इमेज जनरेट करें:

Python

prompt="Panning wide shot of a calico kitten sleeping in the sunshine",

imagen = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(
      aspect_ratio="16:9",
      number_of_images=1
    )
)

imagen.generated_images[0].image

इसके बाद, पहले फ़्रेम के तौर पर, जनरेट की गई इमेज का इस्तेमाल करके वीडियो जनरेट करें:

Python

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt=prompt,
    image = imagen.generated_images[0].image,
    config=types.GenerateVideosConfig(
      # person_generation only accepts "dont_allow" for image-to-video
      aspect_ratio="16:9",  # "16:9" or "9:16"
      number_of_videos=2
    ),
)

# Wait for videos to generate
 while not operation.done:
  time.sleep(20)
  operation = client.operations.get(operation)

for n, video in enumerate(operation.response.generated_videos):
    fname = f'with_image_input{n}.mp4'
    print(fname)
    client.files.download(file=video.video)
    video.video.save(fname)

Veo मॉडल के पैरामीटर

(नाम रखने के तरीके, प्रोग्रामिंग भाषा के हिसाब से अलग-अलग होते हैं.)

  • prompt: वीडियो के लिए टेक्स्ट प्रॉम्प्ट. अगर image पैरामीटर मौजूद है, तो उसे इस्तेमाल करना ज़रूरी नहीं है.
  • image: वीडियो के पहले फ़्रेम के तौर पर इस्तेमाल की जाने वाली इमेज. अगर prompt पैरामीटर मौजूद है, तो उसे इस्तेमाल करना ज़रूरी नहीं है.
  • negativePrompt: टेक्स्ट स्ट्रिंग, जिसमें ऐसी चीज़ों के बारे में बताया गया हो जिन्हें आपको मॉडल को जनरेट करने से हतोत्साहित करना है
  • aspectRatio: जनरेट किए गए वीडियो का आसपेक्ट रेशियो बदलता है. "16:9" और "9:16" को वैल्यू के तौर पर इस्तेमाल किया जा सकता है. डिफ़ॉल्ट रूप से, यह "16:9" पर सेट होता है.
  • personGeneration: मॉडल को लोगों के वीडियो जनरेट करने की अनुमति दें. ये वैल्यू इस्तेमाल की जा सकती हैं:
    • टेक्स्ट से वीडियो जनरेट करने की सुविधा:
      • "dont_allow": लोगों या चेहरों को शामिल करने की अनुमति न दें.
      • "allow_adult": ऐसे वीडियो जनरेट करें जिनमें वयस्कों को दिखाया गया हो, लेकिन बच्चों को नहीं.
    • इमेज से वीडियो जनरेट करने की सुविधा:
      • "dont_allow": इमेज से वीडियो बनाने की सुविधा के लिए, डिफ़ॉल्ट और एकमात्र वैल्यू.
  • numberOfVideos: 1 या 2 में से, वीडियो के लिए अनुरोध किया गया आउटपुट.
  • durationSeconds: हर आउटपुट वीडियो की अवधि सेकंड में, जो 5 से 8 के बीच होनी चाहिए.
  • enhance_prompt: प्रॉम्प्ट को फिर से लिखने की सुविधा को चालू या बंद करें. डिफ़ॉल्ट रूप से चालू होता है.

इन्हें आज़माएँ

Veo का ज़्यादा से ज़्यादा फ़ायदा पाने के लिए, अपने प्रॉम्प्ट में वीडियो से जुड़े शब्द शामिल करें. Veo, इनसे जुड़ी कई तरह की शर्तों को समझता है:

  • शॉट का कॉम्पोज़िशन: शॉट में फ़्रेमिंग और ऑब्जेक्ट की संख्या बताएं (उदाहरण के लिए, "सिंगल शॉट," "टू शॉट," "ओवर-द-शोल्डर शॉट").
  • कैमरे की पोज़िशन और मूवमेंट: "आंखों के लेवल पर," "हाई ऐंगल," "वर्म्स ऐंगल," "डॉली शॉट," "ज़ूम शॉट," "पैन शॉट," और "ट्रैकिंग शॉट" जैसे शब्दों का इस्तेमाल करके, कैमरे की पोज़िशन और मूवमेंट को कंट्रोल करें.
  • फ़ोकस और लेंस इफ़ेक्ट: खास विज़ुअल इफ़ेक्ट पाने के लिए, "शैलो फ़ोकस," "डीप फ़ोकस," "सॉफ़्ट फ़ोकस," "मैक्रो लेंस," और "वाइड-ऐंगल लेंस" जैसे शब्दों का इस्तेमाल करें.
  • स्टाइल और विषय: "साइंस फ़िक्शन," "रोमैंटिक कॉमेडी," "ऐक्शन मूवी" या "ऐनिमेशन" जैसे स्टाइल बताकर, Veo के क्रिएटिव डायरेक्शन को गाइड करें. आपके पास अपने पसंदीदा विषयों और बैकग्राउंड के बारे में बताने का विकल्प भी है. जैसे, "शहर की झलक," "प्रकृति," "वाहन" या "जानवर."

Veo के प्रॉम्प्ट के लिए गाइड

Veo गाइड के इस सेक्शन में, ऐसे वीडियो के उदाहरण दिए गए हैं जिन्हें Veo का इस्तेमाल करके बनाया जा सकता है. साथ ही, इसमें अलग-अलग नतीजे पाने के लिए, प्रॉम्प्ट में बदलाव करने का तरीका भी बताया गया है.

सुरक्षा से जुड़े फ़िल्टर

Veo, Gemini में सुरक्षा फ़िल्टर लागू करता है. इससे यह पक्का करने में मदद मिलती है कि जनरेट किए गए वीडियो और अपलोड की गई फ़ोटो में आपत्तिजनक कॉन्टेंट न हो. ऐसे प्रॉम्प्ट ब्लॉक कर दिए जाते हैं जो हमारी शर्तों और दिशा-निर्देशों का उल्लंघन करते हैं.

प्रॉम्प्ट लिखने के बारे में बुनियादी जानकारी

अच्छे प्रॉम्प्ट, जानकारी देने वाले और साफ़ तौर पर समझ में आने वाले होते हैं. जनरेट किया गया वीडियो, आपकी पसंद के मुताबिक हो, इसके लिए सबसे पहले अपने मुख्य आइडिया की पहचान करें. इसके बाद, कीवर्ड और मॉडिफ़ायर जोड़कर अपने आइडिया को बेहतर बनाएं.

प्रॉम्प्ट में ये एलिमेंट शामिल होने चाहिए:

  • विषय: वह ऑब्जेक्ट, व्यक्ति, जानवर या जगह जिसे आपको अपने वीडियो में दिखाना है.
  • कॉन्टेक्स्ट: वह बैकग्राउंड या कॉन्टेक्स्ट जिसमें ऑब्जेक्ट को रखा गया है.
  • कार्रवाई: वीडियो में व्यक्ति क्या कर रहा है. उदाहरण के लिए, चल रहा है, दौड़ रहा है या अपना सिर घुमा रहा है.
  • स्टाइल: यह सामान्य या बहुत खास हो सकता है. फ़िल्म के स्टाइल से जुड़े खास कीवर्ड का इस्तेमाल करें. जैसे, हॉरर फ़िल्म, फ़िल्म नोयर या ऐनिमेशन वाले स्टाइल, जैसे कि कार्टून स्टाइल.
  • कैमरे का मोशन: [ज़रूरी नहीं] कैमरे से क्या किया जा रहा है, जैसे कि एरियल व्यू, आंखों के लेवल पर, ऊपर से नीचे की ओर शॉट या लो-ऐंगल शॉट.
  • कॉम्पोज़िशन: [ज़रूरी नहीं] शॉट को कैसे फ़्रेम किया गया है, जैसे कि वाइड शॉट, क्लोज़-अप या एक्सट्रीम क्लोज़-अप.
  • Ambiance: [ज़रूरी नहीं] रंग और रोशनी, सीन में कैसे योगदान देती है, जैसे कि नीले रंग के टोन, रात या वॉर्म टोन.

प्रॉम्प्ट लिखने के बारे में ज़्यादा सलाह

यहां दी गई सलाह से, वीडियो जनरेट करने वाले प्रॉम्प्ट लिखने में मदद मिलती है:

  • ज़्यादा जानकारी देने वाली भाषा का इस्तेमाल करें: Veo को साफ़ तौर पर जानकारी देने के लिए, विशेषण और क्रियाविशेषण का इस्तेमाल करें.
  • संदर्भ दें: अगर ज़रूरी हो, तो बैकग्राउंड की जानकारी शामिल करें, ताकि आपके मॉडल को यह समझने में मदद मिल सके कि आपको क्या चाहिए.
  • किसी खास कलात्मक स्टाइल का रेफ़रंस दें: अगर आपको किसी खास स्टाइल का इस्तेमाल करना है, तो किसी खास कलात्मक स्टाइल या आर्ट मूवमेंट का रेफ़रंस दें.
  • प्रॉम्प्ट इंजीनियरिंग टूल का इस्तेमाल करना: प्रॉम्प्ट इंजीनियरिंग टूल या संसाधनों का इस्तेमाल करके, अपने प्रॉम्प्ट को बेहतर बनाएं और बेहतर नतीजे पाएं. ज़्यादा जानकारी के लिए, प्रॉम्प्ट डिज़ाइन के बारे में जानकारी पर जाएं.
  • अपनी निजी और ग्रुप इमेज में चेहरे की जानकारी को बेहतर बनाएं: फ़ोटो के फ़ोकस के तौर पर चेहरे की जानकारी दें. जैसे, प्रॉम्प्ट में पोर्ट्रेट शब्द का इस्तेमाल करना.

प्रॉम्प्ट और आउटपुट के उदाहरण

इस सेक्शन में कई प्रॉम्प्ट दिए गए हैं. इनसे यह पता चलता है कि ज़्यादा जानकारी देने से, हर वीडियो की परफ़ॉर्मेंस को बेहतर कैसे बनाया जा सकता है.

आइसिकल्स

इस वीडियो में बताया गया है कि प्रॉम्प्ट लिखने की बुनियादी बातों के एलिमेंट को अपने प्रॉम्प्ट में कैसे इस्तेमाल किया जा सकता है.

प्रॉम्प्ट जनरेट किया गया आउटपुट
बर्फ़ से जमी हुई चट्टान की दीवार (कॉन्टेक्स्ट) पर, पिघलती हुई आइसिकल (विषय) का क्लोज़-अप शॉट (कंपोज़िशन). इसमें नीले रंग के कूल टोन (ऐंबियंस) का इस्तेमाल किया गया है. साथ ही, कैमरे को ज़ूम इन (कैमरा मोशन) किया गया है, ताकि पानी के टपकने (ऐक्शन) की क्लोज़-अप जानकारी मिल सके. नीले बैकग्राउंड पर टपकते हुए हिमखंड.

फ़ोन पर बात करते हुए व्यक्ति

इन वीडियो में बताया गया है कि अपने प्रॉम्प्ट में ज़्यादा जानकारी डालकर, Veo को अपनी पसंद के मुताबिक आउटपुट बनाने के लिए कैसे कहा जा सकता है.

प्रॉम्प्ट जनरेट किया गया आउटपुट विश्लेषण
कैमरा, हरे रंग के ट्रेंच कोट में एक परेशान व्यक्ति का क्लोज़ अप दिखाने के लिए, डॉली करता है. वह हरे रंग की नियॉन लाइट वाले रोटरी स्टाइल वाले दीवार के फ़ोन से कॉल कर रहा है. यह किसी फ़िल्म के सीन जैसा दिखता है. फ़ोन पर बात करता हुआ आदमी. प्रॉम्प्ट के आधार पर जनरेट किया गया पहला वीडियो.
क्लोज़-अप सिनेमैटिक शॉट में, एक व्यक्ति को दिखाया गया है. वह हरे रंग के पुराने ट्रेंच कोट में है और एक रोटरी फ़ोन डायल कर रहा है. यह फ़ोन, गंदे ईंट की दीवार पर लगा है. साथ ही, हरे रंग के नीऑन साइन की रोशनी में चमक रहा है. कैमरा ज़ूम इन करता है, जिससे उसके जबड़े में तनाव और उसके चेहरे पर निराशा दिखती है. ऐसा इसलिए, क्योंकि वह कॉल करने में परेशानी महसूस कर रहा है. इसमें, शॉर्ट डेप्थ ऑफ़ फ़ील्ड का इस्तेमाल करके, व्यक्ति के भौंहों के बीच की लकीर और काले रंग के रोटरी फ़ोन पर फ़ोकस किया गया है. साथ ही, बैकग्राउंड को नीऑन रंगों और धुंधली परछाइयों के समुद्र में धुंधला कर दिया गया है. इससे, ज़रूरत और अलगाव की भावना पैदा होती है. फ़ोन पर बात करता हुआ आदमी ज़्यादा जानकारी वाले प्रॉम्प्ट से, बेहतर माहौल वाला वीडियो मिलता है.
स्मूद मोशन वाला वीडियो, जिसमें हरे रंग के ट्रेंच कोट में एक व्यक्ति को दिखाया गया है. वह दीवार के पास, एक पुराने रोटरी फ़ोन का इस्तेमाल कर रहा है. दीवार पर हरा नेन लाइट का अजीब रोशनी है. कैमरा पहले थोड़ी दूरी पर है. इसके बाद, धीरे-धीरे वह आदमी के चेहरे के करीब आता है. इससे, फ़ोन डायल करते समय उसके चेहरे पर मौजूद परेशानी और पसीने की जानकारी मिलती है. फ़ोकस, उस आदमी के हाथों पर है. वह कनेक्ट करने की कोशिश करते हुए, डायल को उंगलियों से दबा रहा है. हरे रंग की नेनॉन लाइट की वजह से दीवार पर लंबी परछाईयां पड़ रही हैं. इससे माहौल और भी तनावपूर्ण हो गया है. इस दृश्य को फ़्रेम करने का मकसद, व्यक्ति के अलग-थलग होने और उसकी निराशा पर ज़ोर देना है. साथ ही, इसमें नीऑन की चमकदार रोशनी और व्यक्ति के गंभीर तेवर के बीच का ज़बरदस्त अंतर दिखाया गया है. फ़ोन पर बात करता हुआ आदमी. ज़्यादा जानकारी जोड़ने से, सब्जेक्ट को ज़्यादा असली लुक मिलता है. साथ ही, ज़्यादा बेहतर और शानदार सीन बनता है.

हिम तेंदुआ

इस उदाहरण में, एक आसान प्रॉम्प्ट के लिए Veo का जनरेट किया गया आउटपुट दिखाया गया है.

प्रॉम्प्ट जनरेट किया गया आउटपुट
3D कार्टून स्टाइल में रेंडर किया गया, हिम तेंदुए की तरह के फ़र वाला एक प्यारा जीव, सर्दियों के जंगल में चल रहा है. स्नो लेपर्ड सुस्त हो गया है.

दौड़ता हुआ हिम तेंदुआ

इस प्रॉम्प्ट में ज़्यादा जानकारी होती है. साथ ही, इसमें जनरेट किया गया आउटपुट दिखता है, जो शायद आपके वीडियो के हिसाब से हो.

प्रॉम्प्ट जनरेट किया गया आउटपुट
कार्टून स्टाइल में, खुशी से भरे 3D ऐनिमेशन वाला छोटा सा सीन बनाएं. एक प्यारा जीव, जिसकी फ़र स्नो लेपर्ड जैसी है. साथ ही, बड़ी और भाव भरे नज़र वाली आंखें हैं. यह जीव, सर्दियों के जंगल में खुशी-खुशी घूम रहा है. इस सीन में, गोल आकार के बर्फ़ से ढके पेड़, धीरे-धीरे गिरते हुए बर्फ़ के टुकड़े, और टहनियों से गुज़रती हुई गर्म धूप दिखनी चाहिए. इस जीव की उछलती हुई गतिविधियों और बड़ी मुस्कान से, खुशी का एहसास होना चाहिए. चमकीले और खुशनुमा रंगों और मज़ेदार ऐनिमेशन का इस्तेमाल करके, वीडियो को दिलचस्प और मज़ेदार बनाएं. स्नो लेपर्ड तेज़ी से चल रहा है.

लिखने के एलिमेंट के उदाहरण

इन उदाहरणों में, हर बुनियादी एलिमेंट के हिसाब से अपने प्रॉम्प्ट को बेहतर बनाने का तरीका बताया गया है.

विषय

इस उदाहरण में, विषय की जानकारी देने का तरीका बताया गया है.

विषय की जानकारी प्रॉम्प्ट जनरेट किया गया आउटपुट
ब्यौरे में एक विषय या एक से ज़्यादा विषय और कार्रवाइयां शामिल हो सकती हैं. यहां हमारा विषय "सफ़ेद कंक्रीट की अपार्टमेंट बिल्डिंग" है. सफ़ेद कंक्रीट से बनी अपार्टमेंट बिल्डिंग की आर्किटेक्चरल रेंडरिंग. इसमें ऑर्गैनिक आकार और हरियाली के साथ-साथ फ़्यूचरिस्टिक एलिमेंट का इस्तेमाल किया गया है प्लेसहोल्डर.

संदर्भ

इस उदाहरण में, कॉन्टेक्स्ट तय करने का तरीका बताया गया है.

Context प्रॉम्प्ट जनरेट किया गया आउटपुट
जिस बैकग्राउंड या कॉन्टेक्स्ट में ऑब्जेक्ट को रखा जाएगा वह बहुत ज़रूरी है. अपने विषय को अलग-अलग बैकग्राउंड में रखकर देखें. जैसे, व्यस्त सड़क या अंतरिक्ष में. बैकग्राउंड में चांद और कुछ तारों के साथ, बाहरी अंतरिक्ष में तैरता हुआ उपग्रह. वायुमंडल में तैरता हुआ सैटलाइट.

कार्रवाई

इस उदाहरण में, कार्रवाई तय करने का तरीका बताया गया है.

कार्रवाई प्रॉम्प्ट जनरेट किया गया आउटपुट
सब्जेक्ट क्या कर रहा है, जैसे कि चलना, दौड़ना या सिर घुमाना. समुद्र तट पर टहलती हुई महिला का वाइड शॉट. इसमें, डूबते सूरज के ओर देखती हुई महिला को संतुष्ट और आरामदायक स्थिति में दिखाया गया है. यहां का सूर्यास्त बहुत खूबसूरत होता है.

स्टाइल

इस उदाहरण में, स्टाइल तय करने का तरीका बताया गया है.

स्टाइल प्रॉम्प्ट जनरेट किया गया आउटपुट
जनरेट की गई इमेज की क्वालिटी को बेहतर बनाने और उसे अपनी पसंद के स्टाइल के करीब बनाने के लिए, कीवर्ड जोड़े जा सकते हैं. जैसे, शॉर्ट डेप्थ ऑफ फ़ील्ड, मूवी स्टिल, कम से कम चीज़ों वाला, असली से ज़्यादा बेहतर, पुराने जमाने का, फ़्यूचरिस्टिक या डबल एक्सपोज़र. फ़िल्म नोयर स्टाइल, सड़क पर चलते हुए एक पुरुष और महिला, रहस्य, सिनेमैटिक, ब्लैक ऐंड व्हाइट. फ़िल्म नोयर स्टाइल बहुत खूबसूरत है.

कैमरे का मूवमेंट

इस उदाहरण में, कैमरे के मूवमेंट की जानकारी देने का तरीका बताया गया है.

कैमरे की मूवमेंट प्रॉम्प्ट जनरेट किया गया आउटपुट
कैमरे की मोशन के विकल्पों में, पीओवी शॉट, हवाई व्यू, ड्रोन व्यू को ट्रैक करना या ट्रैकिंग शॉट शामिल हैं. कनाडा में रात में बारिश के दौरान, विंटेज कार से ड्राइविंग करते हुए लिया गया पीओवी शॉट. यह शॉट सिनेमाई है. यहां का सूर्यास्त बहुत खूबसूरत होता है.

कंपोज़िशन

इस उदाहरण में, कंपोज़िशन की जानकारी देने का तरीका बताया गया है.

कॉम्पोज़िशन प्रॉम्प्ट जनरेट किया गया आउटपुट
शॉट को कैसे फ़्रेम किया गया है (वाइड शॉट, क्लोज़-अप, लो ऐंगल). किसी आंख का एक्सट्रीम क्लोज़-अप, जिसमें शहर की झलक दिख रही है. यहां का सूर्यास्त बहुत खूबसूरत होता है.
सर्फ़बोर्ड के साथ समुद्र तट पर चल रहे सर्फ़र का वाइड शॉट, खूबसूरत सूर्यास्त, सिनेमैटिक. यहां का सूर्यास्त बहुत खूबसूरत होता है.

परिवेश

इस उदाहरण में, माहौल की जानकारी देने का तरीका बताया गया है.

Ambiance प्रॉम्प्ट जनरेट किया गया आउटपुट
फ़ोटोग्राफ़ी में कलर पैलेट की अहम भूमिका होती है. ये फ़ोटो के मूड को तय करते हैं और भावनाओं को दिखाते हैं. "नारंगी के म्यूट किए गए वॉर्म टोन", "नैचुरल लाइट", "सूर्योदय" या "सूर्यास्त" जैसे वाक्य बोलकर देखें. उदाहरण के लिए, किसी फ़ोटो में रोमैंटिक और माहौल के हिसाब से रंगों का इस्तेमाल करके, उसे शानदार बनाया जा सकता है. पार्क में धूप में, गोल्डन रिट्रीवर नस्ल के प्यारे पिल्ले को पकड़े हुए लड़की की क्लोज़-अप इमेज. एक छोटी लड़की की गोद में पिल्ला.
बारिश में बस में सफ़र कर रही एक उदास महिला का सिनेमैटिक क्लोज़-अप शॉट. इसमें नीले रंग के कूल टोन और उदास मूड का इस्तेमाल किया गया है. बस में सफ़र कर रही एक महिला उदास है.

वीडियो जनरेट करने के लिए, रेफ़रंस इमेज का इस्तेमाल करना

Veo की इमेज को वीडियो में बदलने की सुविधा का इस्तेमाल करके, इमेज को ज़िंदा किया जा सकता है. आपके पास मौजूदा ऐसेट का इस्तेमाल करने का विकल्प है. इसके अलावा, कुछ नया जनरेट करने के लिए, Imagen का इस्तेमाल भी किया जा सकता है.

प्रॉम्प्ट जनरेट किया गया आउटपुट
चॉकलेट कैंडी बार के साथ बनी बनी. बन्नी भाग रही है.
बन्नी भाग जाती है. बन्नी भाग रही है.

नेगेटिव प्रॉम्प्ट

नेगेटिव प्रॉम्प्ट, ऐसे एलिमेंट को हटाने में मदद करने वाला एक बेहतरीन टूल हो सकता है जिन्हें आपको वीडियो में शामिल नहीं करना है. "नेगेटिव प्रॉम्प्ट" वाक्यांश के बाद, बताएं कि आपको मॉडल को किस तरह के कॉन्टेंट को जनरेट करने से रोकना है. ये सलाह अपनाएं:

  • ❌ निर्देश देने वाली भाषा या नहीं या न करें जैसे शब्दों का इस्तेमाल न करें. उदाहरण के लिए, "कोई दीवार नहीं" या "दीवारें न दिखाएं".

  • ✅ यह बताएं कि आपको क्या नहीं देखना है. उदाहरण के लिए, "दीवार, फ़्रेम", जिसका मतलब है कि आपको वीडियो में दीवार या फ़्रेम नहीं चाहिए.

प्रॉम्प्ट जनरेट किया गया आउटपुट
एक बड़े और अकेले ओक पेड़ का छोटा और स्टाइलिश ऐनिमेशन जनरेट करें. इसमें, तेज़ हवा में पेड़ के पत्ते झूलते हुए दिखें. पेड़ का आकार थोड़ा बढ़ा-चढ़ाकर दिखाया गया हो और उसमें डाइनैमिक और लचीली शाखाएं हों. पत्तियां, पतझड़ के अलग-अलग रंगों में होनी चाहिए. साथ ही, हवा में घूमती और झूमती हुई दिखनी चाहिए. ऐनिमेशन में, वॉर्म और आकर्षक कलर पैलेट का इस्तेमाल किया जाना चाहिए. इस्तेमाल किए गए शब्दों वाला ट्री.
एक बड़े और अकेले ओक पेड़ का छोटा और स्टाइलिश ऐनिमेशन जनरेट करें. इसमें, तेज़ हवा में पेड़ के पत्ते झूलते हुए दिखें. पेड़ का आकार थोड़ा बढ़ा-चढ़ाकर दिखाया गया हो और उसमें डाइनैमिक और लचीली शाखाएं हों. पत्तियां, पतझड़ के अलग-अलग रंगों में होनी चाहिए. साथ ही, हवा में घूमती और झूमती हुई दिखनी चाहिए. ऐनिमेशन में, वॉर्म और आकर्षक कलर पैलेट का इस्तेमाल किया जाना चाहिए.

नकारात्मक प्रॉम्प्ट के साथ - शहरी बैकग्राउंड, इंसानों के बनाए हुए स्ट्रक्चर, अंधेरा, तूफान या खतरनाक माहौल.
बिना नेगेटिव कीवर्ड वाला ट्री.

आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात)

Gemini Veo वीडियो जनरेशन, इन दो आसपेक्ट रेशियो के साथ काम करता है:

आसपेक्ट रेशियो जानकारी
वाइडस्क्रीन या 16:9 टीवी, मॉनिटर, और मोबाइल फ़ोन की स्क्रीन (लैंडस्केप) के लिए सबसे आम आसपेक्ट रेशियो. इसका इस्तेमाल तब करें, जब आपको ज़्यादा बैकग्राउंड कैप्चर करना हो. जैसे, खूबसूरत लैंडस्केप.
पोर्ट्रेट या 9:16 घुमाया गया वाइडस्क्रीन. YouTube Shorts जैसे कम अवधि के वीडियो ऐप्लिकेशन की वजह से, इस आसपेक्ट रेशियो को लोकप्रियता मिली है. इसका इस्तेमाल, वर्टिकल ओरिएंटेशन वाले पोर्ट्रेट या ऊंचे ऑब्जेक्ट के लिए करें. जैसे, इमारतें, पेड़, झरना या इमारतें.

वाइडस्क्रीन

यह प्रॉम्प्ट, वाइडस्क्रीन आसपेक्ट रेशियो 16:9 का उदाहरण है.

प्रॉम्प्ट जनरेट किया गया आउटपुट
ड्रोन से ट्रैक किए गए वीडियो में, 1970 के दशक में पाम स्प्रिंग्स में लाल रंग की कन्वर्टिबल कार चलाते हुए एक व्यक्ति को दिखाएं. वीडियो में, ज़्यादा रोशनी और लंबी परछाईयां दिखनी चाहिए. वॉटरफ़ॉल बहुत खूबसूरत है.

पोर्ट्रेट

यह प्रॉम्प्ट, 9:16 के आसपेक्ट रेशियो वाले पोर्ट्रेट मोड का उदाहरण है.

प्रॉम्प्ट जनरेट किया गया आउटपुट
हरी-भरी जंगलों के बीच, हवाई के एक शानदार झरने की स्मूद मोशन वाली क्लिप का वीडियो बनाएं. शांत माहौल दिखाने के लिए, पानी के असली बहाव, पत्तियों की बारीकी से दिखाई गई इमेज, और नैचुरल लाइटिंग पर फ़ोकस करें. तेज़ी से बहते पानी, धुंधले माहौल, और घने पेड़ों के बीच से छनकर आने वाली सूरज की रोशनी को कैप्चर करें. झरने और उसके आस-पास की जगहों को दिखाने के लिए, कैमरे को धीरे-धीरे और सिनेमैटिक तरीके से घुमाएं. दर्शकों को हवाई के वर्षावन की शांत खूबसूरती की झलक दिखाने के लिए, वीडियो को शांत और असल टोन में बनाएं. वॉटरफ़ॉल बहुत खूबसूरत है.

आगे क्या करना है

  • Veo Colab की मदद से, एआई से बनाए गए वीडियो जनरेट करने का ज़्यादा अनुभव पाएं.