Wprowadzamy tryb wsadowy z wyższymi limitami szybkości i 50% rabatem na tokeny. Więcej informacji

Ta strona została przetłumaczona przez Cloud Translation API.

Generowanie filmu za pomocą Veo

Gemini API zapewnia dostęp do Veo 2, najbardziej zaawansowanego modelu generowania filmów od Google. Veo generuje filmy w różnych stylach filmowych i wizualnych, uwzględniając subtelności promptu, aby renderować skomplikowane szczegóły w sposób spójny w poszczególnych klatkach. Z tego przewodnika dowiesz się, jak zacząć korzystać z Veo za pomocą interfejsu Gemini API.

Wskazówki dotyczące promptów wideo znajdziesz w sekcji Przewodnik po promptach Veo.

Zanim zaczniesz

Zanim wywołasz interfejs Gemini API, upewnij się, że masz zainstalowany wybrany pakiet SDK oraz skonfigurowany i gotowy do użycia klucz interfejsu Gemini API.

Aby korzystać z Veo z pakietami SDK Google Gen AI, musisz mieć zainstalowaną jedną z tych wersji:

Python w wersji 1.10.0 lub nowszej
TypeScript i JavaScript v0.8.0 lub nowsza wersja
Go w wersji 1.0.0 lub nowszej

Generuj filmy

W tej sekcji znajdziesz przykłady kodu do generowania filmów za pomocą promptów tekstowych i za pomocą obrazów.

Generowanie na podstawie tekstu

Aby wygenerować filmy za pomocą Veo, możesz użyć tego kodu:

Python

import time
from google import genai
from google.genai import types

client = genai.Client()

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt="Panning wide shot of a calico kitten sleeping in the sunshine",
    config=types.GenerateVideosConfig(
        person_generation="dont_allow",  # "dont_allow" or "allow_adult"
        aspect_ratio="16:9",  # "16:9" or "9:16"
    ),
)

while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)

for n, generated_video in enumerate(operation.response.generated_videos):
    client.files.download(file=generated_video.video)
    generated_video.video.save(f"video{n}.mp4")  # save the video

JavaScript

import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({});

async function main() {
  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    config: {
      personGeneration: "dont_allow",
      aspectRatio: "16:9",
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(`${generatedVideo.video?.uri}&key=GEMINI_API_KEY`); // append your API key
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();

Przeczytaj

package main

import (
  "context"
  "fmt"
  "os"
  "time"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:      "16:9",
      PersonGeneration: "dont_allow",
  }

  operation, _ := client.Models.GenerateVideos(
      ctx,
      "veo-2.0-generate-001",
      "Panning wide shot of a calico kitten sleeping in the sunshine",
      nil,
      videoConfig,
  )

  for !operation.Done {
      time.Sleep(20 * time.Second)
      operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
  }

  for n, video := range operation.Response.GeneratedVideos {
      client.Files.Download(ctx, video.Video, nil)
      fname := fmt.Sprintf("video_%d.mp4", n)
      _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
  }
}

REST

# Use curl to send a POST request to the predictLongRunning endpoint.
# The request body includes the prompt for video generation.
curl "${BASE_URL}/models/veo-2.0-generate-001:predictLongRunning" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -X "POST" \
  -d '{
    "instances": [{
        "prompt": "Panning wide shot of a calico kitten sleeping in the sunshine"
      }
    ],
    "parameters": {
      "aspectRatio": "16:9",
      "personGeneration": "dont_allow",
    }
  }' | tee result.json | jq .name | sed 's/"//g' > op_name

# Obtain operation name to download video.
op_name=$(cat op_name)

# Check against status of operation.
while true; do
  is_done=$(curl -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${op_name}" | tee op_check.json | jq .done)

  if [ "${is_done}" = "true" ]; then
    cat op_check.json
    echo "** Attach API_KEY to download video, or examine error message."
    break
  fi

  echo "** Video ${op_name} has not downloaded yet!  Check again after 5 seconds..."

  # Wait for 5 seoncds to check again.
  sleep 5

done

Kotek śpiący na słońcu.

Wykonanie tego kodu zajmuje 2–3 minuty, ale może potrwać dłużej, jeśli zasoby są ograniczone. Po zakończeniu procesu powinien wyświetlić się film podobny do tego:

Jeśli zamiast filmu zobaczysz komunikat o błędzie, oznacza to, że zasoby są ograniczone i nie udało się zrealizować Twojego żądania. W takim przypadku uruchom kod ponownie.

Wygenerowane filmy są przechowywane na serwerze przez 2 dni, a potem usuwane. Jeśli chcesz zapisać lokalną kopię wygenerowanego filmu, musisz uruchomić result() i save() w ciągu 2 dni od wygenerowania.

Generowanie na podstawie obrazów

Możesz też generować filmy za pomocą obrazów. Poniższy kod generuje obraz za pomocą Imagen, a potem używa go jako początkowej ramki wygenerowanego filmu.

Najpierw wygeneruj obraz za pomocą Imagen:

Python

prompt="Panning wide shot of a calico kitten sleeping in the sunshine",

imagen = client.models.generate_images(
    model="imagen-3.0-generate-002",
    prompt=prompt,
    config=types.GenerateImagesConfig(
      aspect_ratio="16:9",
      number_of_images=1
    )
)

imagen.generated_images[0].image

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});
const response = await ai.models.generateImages({
  model: "imagen-3.0-generate-002",
  prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
  config: {
    numberOfImages: 1,
  },
});

// you'll pass response.generatedImages[0].image.imageBytes to Veo

Przeczytaj

package main

import (
    "context"
    "fmt"
    "os"
    "time"
    "google.golang.org/genai"
)

func main() {

    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

    config := &genai.GenerateImagesConfig{
        AspectRatio:    "16:9",
        NumberOfImages: 1,
    }

    response, _ := client.Models.GenerateImages(
        ctx,
        "imagen-3.0-generate-002",
        "Panning wide shot of a calico kitten sleeping in the sunshine",
        config,
    )

    // you'll pass response.GeneratedImages[0].Image to Veo
}

Następnie wygeneruj film, używając uzyskanego obrazu jako pierwszej klatki:

Python

operation = client.models.generate_videos(
    model="veo-2.0-generate-001",
    prompt=prompt,
    image = imagen.generated_images[0].image,
    config=types.GenerateVideosConfig(
      person_generation="dont_allow",  # "dont_allow" or "allow_adult"
      aspect_ratio="16:9",  # "16:9" or "9:16"
      number_of_videos=2
    ),
)

# Wait for videos to generate
 while not operation.done:
  time.sleep(20)
  operation = client.operations.get(operation)

for n, video in enumerate(operation.response.generated_videos):
    fname = f'with_image_input{n}.mp4'
    print(fname)
    client.files.download(file=video.video)
    video.video.save(fname)

JavaScript

import { GoogleGenAI } from "@google/genai";
import { createWriteStream } from "fs";
import { Readable } from "stream";

const ai = new GoogleGenAI({});

async function main() {
  // get image bytes from Imagen, as shown above

  let operation = await ai.models.generateVideos({
    model: "veo-2.0-generate-001",
    prompt: "Panning wide shot of a calico kitten sleeping in the sunshine",
    image: {
      imageBytes: response.generatedImages[0].image.imageBytes, // response from Imagen
      mimeType: "image/png",
    },
    config: {
      aspectRatio: "16:9",
      numberOfVideos: 2,
    },
  });

  while (!operation.done) {
    await new Promise((resolve) => setTimeout(resolve, 10000));
    operation = await ai.operations.getVideosOperation({
      operation: operation,
    });
  }

  operation.response?.generatedVideos?.forEach(async (generatedVideo, n) => {
    const resp = await fetch(
      `${generatedVideo.video?.uri}&key=GEMINI_API_KEY`, // append your API key
    );
    const writer = createWriteStream(`video${n}.mp4`);
    Readable.fromWeb(resp.body).pipe(writer);
  });
}

main();

Przeczytaj

    image := response.GeneratedImages[0].Image

    videoConfig := &genai.GenerateVideosConfig{
      AspectRatio:    "16:9",
      NumberOfVideos: 2,
    }

    operation, _ := client.Models.GenerateVideos(
        ctx,
        "veo-2.0-generate-001",
        "A dramatic scene based on the input image",
        image,
        videoConfig,
    )

    for !operation.Done {
        time.Sleep(20 * time.Second)
        operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)
    }

    for n, video := range operation.Response.GeneratedVideos {
        client.Files.Download(ctx, video.Video, nil)
        fname := fmt.Sprintf("video_with_image_input_%d.mp4", n)
        _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)
    }

Parametry modelu Veo

(konwencje nazewnictwa różnią się w zależności od języka programowania).

prompt – tekstowy prompt do filmu. Jeśli jest obecny, parametr image jest opcjonalny.
image: obraz, który ma być użyty jako pierwsza klatka filmu. Jeśli jest obecny, parametr prompt jest opcjonalny.
negativePrompt: ciąg tekstowy opisujący wszystko, co chcesz zniechęcić model do generowania.
aspectRatio: zmienia współczynnik proporcji wygenerowanego filmu. Obsługiwane wartości to "16:9" i "9:16". Wartość domyślna to "16:9".
personGeneration: zezwól modelowi na generowanie filmów z udziałem osób. Obsługiwane wartości:
- Generowanie tekstu na film:
  - "dont_allow": nie zezwalaj na dodawanie zdjęć osób ani twarzy.
  - "allow_adult": generowanie filmów, które zawierają dorosłych, ale nie dzieci.
  - "allow_all": generowanie filmów, które zawierają dorosłych i dzieci.
- Przekształcanie obrazu na film:
  - "dont_allow": nie zezwalaj na dodawanie zdjęć osób ani twarzy.
  - "allow_adult": generowanie filmów, które zawierają dorosłych, ale nie dzieci.
- Zobacz ograniczenia.
numberOfVideos: wyjściowe filmy, które mają być wygenerowane: 1 lub 2.
durationSeconds: długość każdego filmu wyjściowego w sekundach, w zakresie od 5 do 8.
enhance_prompt: włączanie i wyłączanie modyfikatora prompta. Ta opcja jest domyślnie włączona.

Specyfikacja

Formy	Generowanie filmu na podstawie tekstu Generowanie filmów na podstawie obrazów
Opóźnienie prośby	Min: 11 sekund Maks.: 6 minut (w godzinach szczytowych)
Generowanie zmiennej długości	5–8 sekund
Rozwiązanie	720p
Liczba klatek	24 kl./s
Format obrazu	16:9 – poziomy 9:16 – orientacja pionowa
Języki wejściowe (tekst na film)	angielski
Ograniczenia	Konwersja obrazu na film `personGeneration` jest niedozwolona w Unii Europejskiej, Wielkiej Brytanii, Szwajcarii i regionach Bliskiego Wschodu i Afryki Północnej Konwersja tekstu na film `personGeneration: "allow_all"` jest niedozwolona w Unii Europejskiej, Wielkiej Brytanii, Szwajcarii i regionie Bliskiego Wschodu i Afryki Północnej

Filmy tworzone przez Veo są oznaczane znakiem wodnym za pomocą SynthID, naszego narzędzia do oznaczania znakami wodnymi i identyfikowania treści generowanych przez AI. Są one również przekazywane przez filtry bezpieczeństwa i procesy sprawdzania zapamiętywania, które pomagają ograniczyć ryzyko związane z prywatnością, prawami autorskimi i uprzedzeniami.

Do wypróbowania

Aby w pełni wykorzystać możliwości Veo, uwzględnij w promptach terminologię związaną z filmem. Veo rozumie wiele terminów związanych z:

Kompozycja ujęcia: określ kadrowanie i liczbę obiektów w ujęciu (np. „single shot”, „two shot”, „over-the-shoulder shot”).
Pozycja i ruchy kamery: możesz kontrolować położenie i ruchy kamery, używając takich terminów jak „poziom oczu”, „wysoki kąt”, „widok z poziomu robaka”, „ujęcie z kamery na szynie”, „ujęcie z zoomem”, „ujęcie z przesuwką” i „ujęcie z podążaniem”.
Efekty ostrości i obiektywu: aby uzyskać określone efekty wizualne, używaj takich terminów jak „płytka ostrość”, „głębia ostrości”, „miękka ostrość”, „makro” i „szerokokątny obiektyw”.
Ogólny styl i temat: kieruj twórczą wizję Veo, określając style takie jak „science fiction”, „komedia romantyczna”, „film akcji” lub „animacja”. Możesz też opisać żądane tematy i tła, np. „widok miasta”, „przyroda”, „pojazdy” lub „zwierzęta”.

Przewodnik po promptach Veo

Ta sekcja przewodnika po Veo zawiera przykłady filmów, które możesz utworzyć za pomocą Veo, oraz pokazuje, jak modyfikować prompty, aby uzyskać różne wyniki.

Filtry bezpieczeństwa

Veo stosuje filtry bezpieczeństwa w Gemini, aby generowane filmy i przesłane zdjęcia nie zawierały treści obraźliwych. Prompty, które naruszają nasze warunki korzystania z usługi i wytyczne, są blokowane.

Podstawy pisania promptów

Dobre prompty są precyzyjne i jasne. Aby wygenerowany film był jak najbardziej zbliżony do Twoich oczekiwań, zacznij od określenia głównej idei, a następnie doprecyzuj ją, dodając słowa kluczowe i modyfikatory.

Prompt powinien zawierać te elementy:

Przedmiot: obiekt, osoba, zwierzę lub krajobraz, które chcesz umieścić w filmie.
Kontekst: tło lub kontekst, w którym znajduje się obiekt.
Działanie: co robi osoba na zdjęciu (np. chodzi, biega lub obraca głowę).
Styl: może być ogólny lub bardzo szczegółowy. Zastanów się nad użyciem słów kluczowych związanych z konkretnym stylem filmowym, takich jak film grozy, film noir czy style animowane, np. animacja.
Ruch kamery: [opcjonalnie] co robi kamera, np. widok z lotu, widok z poziomu oczu, zdjęcie z góry lub zdjęcie z dołu.
Kompozycja: [opcjonalnie] sposób kadrowania ujęcia, np. szeroki plan, zbliżenie lub makro.
Ambiance [opcjonalnie] sposób, w jaki kolor i światło wpływają na scenę, na przykład niebieskie tony, noc lub ciepłe tony.

Więcej wskazówek dotyczących pisania promptów

Te wskazówki pomogą Ci napisać prompty, które będą generować filmy:

Używaj języka opisowego: używaj przymiotników i przysłów, aby przedstawić Veo jasny obraz.
Podaj kontekst: w razie potrzeby podaj informacje ogólne, aby pomóc modelowi zrozumieć, czego oczekujesz.
Użycie konkretnych stylów artystycznych: jeśli masz na myśli określony styl estetyczny, użyj konkretnych stylów artystycznych lub kierunków artystycznych.
Używanie narzędzi do tworzenia promptów: zastanów się nad wykorzystaniem narzędzi lub zasobów do tworzenia promptów, które pomogą Ci je ulepszać i osiągać optymalne wyniki. Więcej informacji znajdziesz w artykule wprowadzającym do projektowania promptów.
Popraw szczegóły twarzy na zdjęciach osobistych i grupowych: określ szczegóły twarzy jako punkt skupienia uwagi na zdjęciu, na przykład używając słowa portret w promptach.

Przykładowe prompty i dane wyjściowe

W tej sekcji znajdziesz kilka promptów, które pokazują, jak szczegółowe informacje mogą poprawić skuteczność każdego filmu.

Sople

Z tego filmu dowiesz się, jak używać elementów podstawy pisania promptów w promptach.

Prompt	Wygenerowane dane wyjściowe
Zbliżenie (kompozycja) topniejących sopli (temat) na zamarzniętym murze skalnym (kontekst) z chłodnymi niebieskimi tonami (środowisko), zbliżenie (ruchy kamery) z zachowaniem szczegółów zbliżenia kropli wody (działanie).

Mężczyzna rozmawia przez telefon

Te filmy pokazują, jak poprawiać prompt, podając coraz więcej szczegółowych informacji, aby Veo mogło dostosować wyniki do Twoich potrzeb.

Prompt	Wygenerowane dane wyjściowe	Analiza
Kamera przesuwa się, aby pokazać zbliżenie zdesperowanego mężczyzny w zielonym prochowcu. Dzwoni on na telefon ścienny z tarczą i zielonym neonowym światłem. Wygląda jak scena z filmu.		To pierwszy film wygenerowany na podstawie prompta.
Zbliżenie w stylu filmowym pokazujące zdesperowanego mężczyznę w wyblakłym zielonym prochowcu, który wybiera numer na telefonie z tarczą zamontowanym na szorstkiej ceglanej ścianie w niesamowitym zielonym neonowym świetle. Kamera zbliża się do twarzy, ukazując napięcie w żuchwie i desperację na twarzy bohatera, gdy ten próbuje wykonać połączenie. Płytka głębia ostrości skupia się na zmarszczonych brwiach i czarnym telefonie obrotowym, a tło staje się morzem neonowych kolorów i nieostrych cieni, co tworzy poczucie pilności i izolacji.		Bardziej szczegółowy prompt powoduje, że film jest bardziej skoncentrowany i zawiera bogatsze środowisko.
Film z płynnym ruchem, który zbliża się do zdesperowanego mężczyzny w zielonym prochowcu, używającego zabytkowego telefonu z tarczą przy ścianie oświetlonej dziwnym zielonym neonem. Kamera zaczyna się od średniej odległości, powoli zbliżając się do twarzy mężczyzny, ukazując jego zaniepokojoną minę i pot na czole, gdy nagle wybiera numer telefonu. Uwypuklenie rąk mężczyzny, który bezskutecznie próbuje połączyć się z telefonem. Zielone światło neonowe rzuca długie cienie na ścianie, co potęguje napiętą atmosferę. Scena jest ujęta w sposób, który podkreśla samotność i desperację mężczyzny, a także wyraźny kontrast między jaskrawym światłem neonu a poważnie nastawionym mężczyzną.		Dodanie większej ilości szczegółów nadaje twarzy realistyczny wyraz i tworzy intensywną, żywą scenę.

irbis śnieżny,

Ten przykład pokazuje dane wyjściowe, które Veo może wygenerować dla prostego promptu.

Prompt	Wygenerowane dane wyjściowe
Urocze stworzenie z futrem jak u śnieżnego lamparta spacerujące w zimowym lesie. Render w stylu kreskówki 3D.

Biegający irbis śnieżny

Ten prompt zawiera więcej szczegółów i pokazuje wygenerowany wynik, który może być bliższy temu, czego oczekujesz od filmu.

Prompt	Wygenerowane dane wyjściowe
Utwórz krótką animowaną scenę 3D w wesołym stylu kreskówki. Urocze stworzenie z futrem w kolorze śnieżnego lamparta, dużymi, wyrazistymi oczami i przyjaznym, zaokrąglonym kształtem radośnie skacze w bajecznym zimowym lesie. Scena powinna przedstawiać zaokrąglone, ośnieżone drzewa, delikatnie spadające płatki śniegu i ciepłe światło słoneczne przebijające przez gałęzie. Jego ruchy i szeroki uśmiech powinny wywołać uśmiech na twarzy. Postaraj się, aby Twój film miał optymistyczny i ciepły ton, a do tego używaj jasnych, wesołych kolorów i zabawnych animacji.

Prompt

Wygenerowane dane wyjściowe

Utwórz krótką animowaną scenę 3D w wesołym stylu kreskówki. Urocze stworzenie z futrem w kolorze śnieżnego lamparta, dużymi, wyrazistymi oczami i przyjaznym, zaokrąglonym kształtem radośnie skacze w bajecznym zimowym lesie. Scena powinna przedstawiać zaokrąglone, ośnieżone drzewa, delikatnie spadające płatki śniegu i ciepłe światło słoneczne przebijające przez gałęzie. Jego ruchy i szeroki uśmiech powinny wywołać uśmiech na twarzy. Postaraj się, aby Twój film miał optymistyczny i ciepły ton, a do tego używaj jasnych, wesołych kolorów i zabawnych animacji.

Przykłady według elementów

Z tych przykładów dowiesz się, jak dopraczać prompty, korzystając z każdego z podstawowych elementów.

Temat

Ten przykład pokazuje, jak określić opis tematu.

Opis tematu	Prompt	Wygenerowane dane wyjściowe
Opis może zawierać jeden lub wiele tematów i działań. W tym przypadku tematem jest „biały betonowy budynek mieszkalny”.	Renderowanie architektoniczne białego betonowego budynku z płynnymi, organicznymi kształtami, który płynnie łączy się z bujną zielenią i futurystycznymi elementami

Kontekst

Ten przykład pokazuje, jak określić kontekst.

Kontekst	Prompt	Wygenerowane dane wyjściowe
Tło lub kontekst, w którym zostanie umieszczony temat, są bardzo ważne. Spróbuj umieścić obiekt na różnych tłach, np. na ruchliwej ulicy lub w kosmosie.	satelita unoszący się w kosmosie na tle księżyca i gwiazd

Działanie

Ten przykład pokazuje, jak określić działanie.

Działanie	Prompt	Wygenerowane dane wyjściowe
Co robi osoba na filmie, np. chodzi, biega lub obraca głowę.	Szeroki plan kobiety chodzącej po plaży. Kobieta jest zadowolona i wygląda na relaksującą osobę. Słońce zachodzi na horyzoncie.

Styl

Ten przykład pokazuje, jak określić styl.

Styl	Prompt	Wygenerowane dane wyjściowe
Możesz dodać słowa kluczowe, aby poprawić jakość generowania i zbliżyć je do wybranego stylu, np. płytka głębia ostrości, kadr z filmu, minimalizm, styl surrealistyczny, vintage, futurystyczny lub podwójna ekspozycja.	Styl film noir, mężczyzna i kobieta idący ulicą, tajemnica, filmowy, czarno-biały.

Ruch kamery

Ten przykład pokazuje, jak określić ruch kamery.

Ruch kamery	Prompt	Wygenerowane dane wyjściowe
Opcje ruchu kamery to m.in. ujęta z perspektywy, lotnicza, ujęta z perspektywy drona lub ujęta z ruchomą kamerą.	Klip z perspektywy kierowcy starego samochodu jadącego w deszczu w Kanadzie w nocy.

Kompozycja

Ten przykład pokazuje, jak określić kompozycję.

Kompozycja	Prompt	Wygenerowane dane wyjściowe
Jak jest ujęta (ujęcie ogólne, zbliżenie, nisko nad ziemią).	Zbliżenie oka z odbiciem miasta.
	Utwórz film z szerokim ujęciem surfera chodzącego po plaży z deską surfingową, piękny zachód słońca, film w stylu filmowym.

Atmosfera

Ten przykład pokazuje, jak określić nastrój.

Ambiance	Prompt	Wygenerowane dane wyjściowe
Palety kolorów odgrywają ważną rolę w fotografii, wpływając na nastrój i przekazywanie emocji. Spróbuj użyć słów takich jak „stonowane ciepłe odcienie pomarańczowego”, „naturalne światło”, „szarówka imitująca światło słoneczne” lub „świt” czy „zachód słońca”. Na przykład ciepła, złota paleta może nadać zdjęciu romantycznego i klimatycznego charakteru.	Zbliżenie na dziewczynkę trzymającą urocze szczeniaki golden retrievera w parku w słoneczny dzień.
	Filmowy zbliżenie smutnej kobiety jadącej autobusem w deszczu, chłodne niebieskie tony, smutny nastrój.

Generowanie filmów za pomocą obrazów referencyjnych

Możesz ożywić obrazy, korzystając z funkcji tworzenia filmów z obrazów w Veo. Możesz użyć dotychczasowych komponentów lub spróbować użyć narzędzia Imagen, aby wygenerować coś nowego.

Prompt	Wygenerowane dane wyjściowe
Królik z czekoladowym batonem.
Królik ucieka.

Prompty negatywne

Prompty negatywne to skuteczne narzędzie pozwalające określić elementy, których nie chcesz mieć w filmie. Po wyrażeniu „Negative prompt” opisz, czego chcesz zniechęcić model do generowania. Postępuj zgodnie z tymi wskazówkami:

❌ Nie używaj słów nakazujących ani słów takich jak nie czy nie. Na przykład: „Bez ścian” lub „Nie pokazuj ścian”.
✅ Opisz, czego nie chcesz zobaczyć. Na przykład „wall, frame”, co oznacza, że nie chcesz, aby w filmie pojawiła się ściana lub rama.

Prompt	Wygenerowane dane wyjściowe
Wygeneruj krótką, stylizowaną animację przedstawiającą samotny dąb z liśćmi mocno poruszanymi przez silny wiatr. Drzewo powinno mieć nieco wyolbrzymioną, dziwaczną formę z dynamicznymi, płynnymi gałęziami. Liście powinny mieć różne jesienne kolory i wirować oraz tańczyć na wietrze. Animacja powinna zawierać ciepłą, zachęcającą paletę kolorów.
Wygeneruj krótką, stylizowaną animację przedstawiającą samotny dąb z liśćmi mocno poruszanymi przez silny wiatr. Drzewo powinno mieć nieco wyolbrzymioną, dziwaczną formę z dynamicznymi, płynnymi gałęziami. Liście powinny mieć różne jesienne kolory i wirować oraz tańczyć na wietrze. Animacja powinna zawierać ciepłą, zachęcającą paletę kolorów. Z negatywnym promptem – tło miejskie, sztuczne struktury, ciemna, burzowa lub groźna atmosfera.

Prompt

Wygenerowane dane wyjściowe

Wygeneruj krótką, stylizowaną animację przedstawiającą samotny dąb z liśćmi mocno poruszanymi przez silny wiatr. Drzewo powinno mieć nieco wyolbrzymioną, dziwaczną formę z dynamicznymi, płynnymi gałęziami. Liście powinny mieć różne jesienne kolory i wirować oraz tańczyć na wietrze. Animacja powinna zawierać ciepłą, zachęcającą paletę kolorów.

Formaty obrazu

Generowanie filmów Gemini Veo obsługuje te 2 formaty obrazu:

Format obrazu	Opis
Panoramiczny lub 16:9	Najczęstszy format obrazu w przypadku telewizorów, monitorów i ekranów telefonów komórkowych (orientacja pozioma). Użyj tej opcji, gdy chcesz uchwycić więcej tła, np. w przypadku krajobrazów.
Pionowo lub 9:16	Obraz panoramiczny po obróbieniu. Ten format został spopularyzowany przez aplikacje do tworzenia krótkich filmów, takie jak YouTube Shorts. Używaj tego trybu do portretów lub wysokich obiektów o silnie pionowej orientacji, takich jak budynki, drzewa czy wodospady.

Panoramiczny

Ten prompt jest przykładem formatu szerokoekranowego 16:9.

Prompt	Wygenerowane dane wyjściowe
Utwórz film z widokiem z kamery drona na mężczyznę jadącego czerwonym kabrioletem w Palm Springs w latach 70. XX w ciepłym świetle słonecznym, długie cienie.

Pionowo

Ten prompt jest przykładem formatu obrazu w orientacji pionowej 9:16.

Prompt	Wygenerowane dane wyjściowe
Utwórz film przedstawiający płynne ruchy majestatycznego hawajskiego wodospadu w bujnym lesie deszczowym. Skup się na realistycznym przepływie wody, szczegółowej roślinności i naturalnym oświetleniu, aby przekazać spokój. Uchwyć spływającą wodę, mglistą atmosferę i promienie słońca przenikające przez gęste liście. Użyj płynnych, filmowych ruchów kamery, aby pokazać wodospad i otaczającą go przyrodę. Postaraj się nadać filmowi spokojny, realistyczny ton, który przeniesie widza w świat piękna hawajskiego lasu deszczowego.

Prompt

Wygenerowane dane wyjściowe

Utwórz film przedstawiający płynne ruchy majestatycznego hawajskiego wodospadu w bujnym lesie deszczowym. Skup się na realistycznym przepływie wody, szczegółowej roślinności i naturalnym oświetleniu, aby przekazać spokój. Uchwyć spływającą wodę, mglistą atmosferę i promienie słońca przenikające przez gęste liście. Użyj płynnych, filmowych ruchów kamery, aby pokazać wodospad i otaczającą go przyrodę. Postaraj się nadać filmowi spokojny, realistyczny ton, który przeniesie widza w świat piękna hawajskiego lasu deszczowego.

Co dalej?

Zdobądź więcej doświadczenia w generowaniu filmów z wykorzystaniem AI za pomocą Veo Colab.
Zobacz ciekawe przykłady użycia Veo 2 na stronie Google DeepMind.