Udostępnij

11 GRUDNIA 2024 R.

Nowe możliwości tworzenia filmów dzięki Gemini 2.0 Flash

Vishal Dharmadhikari

Inżynier ds. rozwiązań produktowych

Hang Chu

Viggle

Baner powitalny prezentacji Viggle

Interfejs Gemini API nie tylko ulepsza aplikacje, ale też wywołuje rewolucję w zakresie kreatywności. Viggle, wirusowa sensacja w świecie filmów wygenerowanych przez AI, która pozwala każdemu przekształcać zdjęcia w urzekające animacje, jest na czele tej rewolucji. Eksperymentując z multimodalną magią Gemini 2.0 Flash, która jest obecnie dostępna tylko w wersji eksperymentalnej – w szczególności z jej zaawansowaną funkcją rozumienia filmów i generowania dźwięku oraz generowania obrazów przez Imagen 3 – Viggle tworzy funkcje, które pozwolą użytkownikom bez wysiłku realizować swoje najśmielsze pomysły w sposób, który do tej pory był niemożliwy.

W świecie Viggle: tworzenie filmów AI z użyciem Gemini 2.0 Flash i Imagen 3

Viggle zdobył już miliony użytkowników dzięki możliwości łatwego przekształcania statycznych zdjęć w animowane filmy z ruchem całego ciała, co wywołało wirusowe treści na platformach mediów społecznościowych. Viggle skupia się na memach i treściach tanecznych. Oferuje aplikacje mobilne (iOS i Android) oraz platformę internetową (viggle.ai). Funkcje takie jak zamiana twarzy, animowanie zdjęć za pomocą ruchów tanecznych i wstawianie użytkowników do scen filmowych są już popularne wśród użytkowników Viggle, a teraz firma szuka nowych sposobów na podniesienie poziomu kreatywności.

Viggle testuje obecnie 2 funkcje wykorzystujące możliwości modeli Gemini 2.0 Flash i Imagen 3:


  • Obraz do wirtualnych postaci wideo: Viggle używa Imagen 3 do generowania obrazów, aby stworzyć kuźnię postaci opartą na AI. Użytkownicy mogą podawać proste prompty tekstowe, np. „tańczący robot ze świecącymi oczami” lub „puszysty, tęczowy smok”, a model wygeneruje unikalne wirtualne postacie gotowe do wystąpienia w ich filmach. Postacie te są następnie płynnie integrowane z silnikiem animacji Viggle, co otwiera świat spersonalizowanych możliwości opowiadania historii. Wyobraź sobie, że reżyserujesz własny animowany film krótkometrażowy z postaciami, które zrodziły się w Twojej wyobraźni – to właśnie możliwości, jakie dają Ci Viggle i Imagen 3.

  • Dynamiczny podkład głosowy AI: Viggle wykorzystuje też funkcję generowania mowy Gemini 2.0 Flash i jego zaawansowane możliwości analizy filmów, aby opracować funkcję dodawania do dowolnego filmu podkładu głosowego z bogatym kontekstem. To nie jest tylko monotonny głos czytający skrypt. To AI, która analizuje treść filmu – identyfikuje kluczowe momenty, działania, a nawet emocje – i generuje narrację, która idealnie pasuje do obrazu. Niezależnie od tego, czy jest to humorystyczny komentarz do filmu z tańcem, czy epicki opis sceny fantasy, narrator AI dodaje zupełnie nowy wymiar zaangażowania.

Nowe możliwości kreatywności i zaangażowania

Integracja generatywnej AI może ulepszyć Viggle na kilka kluczowych sposobów:


  • Uproszczone tworzenie postaci: generowanie obrazów w Imagen 3 upraszcza proces tworzenia i dostosowywania postaci w filmach. Użytkownicy mogą teraz generować unikalne postacie na podstawie swoich pomysłów, co eliminuje potrzebę zaawansowanych umiejętności projektowania lub polegania na ograniczonych gotowych opcjach. Ten uproszczony proces umożliwia większej liczbie użytkowników realizację swoich kreatywnych wizji.

  • Bardziej spersonalizowane treści: Gemini 2.0 Flash umożliwia użytkownikom tworzenie wysoce spersonalizowanych narracji wideo. Specjalnie zaprojektowane postacie w połączeniu z dynamiczną narracją AI umożliwiają tworzenie wyjątkowych historii, które wzmacniają więź między twórcami a odbiorcami.

  • Większe możliwości twórcze: połączenie wirtualnych postaci i narracji AI zwiększa potencjał twórczy krótkich filmów w Viggle. Użytkownicy mogą odkrywać nowe formy opowiadania historii, wykraczające poza tradycyjne formaty wideo.

Co dalej

Firma Viggle z radością będzie dalej badać potencjał Gemini 2.0 i modeli generowania obrazów, aby ulepszać swoją platformę. Wyobraża sobie przyszłość, w której AI będzie płynnie integrować się z każdym etapem procesu twórczego, umożliwiając każdemu tworzenie filmów.

„W Viggle każdy jest twórcą. Tworzymy memy, eksperymentujemy z technologią motion capture, aby realizować projekty na wyższym poziomie, i budujemy własne multiwersum. Dzięki realistycznym możliwościom narracji głosowej Gemini 2.0 Flash nasi użytkownicy zyskają nowe możliwości – będą mogli tworzyć historie jak nigdy dotąd”.

– Hang Chu, założyciel Viggle

Współpraca Viggle z Gemini 2.0 Flash i Imagen 3 pokazuje potencjał AI w zakresie przekształcania procesu tworzenia filmów i zapewniania użytkownikom nowych narzędzi do wyrażania siebie. Ta współpraca to krok w przyszłość opartą na AI. Aby dowiedzieć się więcej o tworzeniu aplikacji z użyciem Gemini, zapoznaj się z dokumentacją interfejsu Gemini API i przeczytaj więcej o Imagen 3, czyli naszych najnowszych osiągnięciach w zakresie generowania obrazów.