Udostępnij

11 grudnia 2024 r.

Nowe możliwości tworzenia filmów dzięki Gemini 2.0 Flash

Vishal Dharmadhikari

Inżynier ds. rozwiązań produktowych

Hang Chu

Viggle

Baner powitalny Viggle

Interfejs Gemini API nie tylko ulepsza aplikacje, ale też wywołuje rewolucję w zakresie kreatywnej ekspresji. Viggle, wirusowa sensacja w świecie filmów wygenerowanych przez AI, która pozwala każdemu przekształcać zdjęcia w urzekające animacje, jest na czele tej rewolucji. Eksperymentując z multimodalną magią Gemini 2.0 Flash, która jest obecnie dostępna tylko w wersji eksperymentalnej – a zwłaszcza z jej zaawansowaną funkcją rozumienia filmów i generowania dźwięku oraz generowania obrazów za pomocą Imagen 3 – Viggle tworzy funkcje, które pozwolą użytkownikom bez wysiłku ożywiać swoje najśmielsze wyobrażenia w sposób, który do tej pory był niemożliwy.

Inside Viggle: Powering AI Video Creation with Gemini 2.0 Flash and Imagen 3

Viggle zdobył już miliony użytkowników dzięki możliwości łatwego przekształcania statycznych zdjęć w animowane filmy z ruchem całego ciała, co wywołało wirusowe treści na platformach mediów społecznościowych. Viggle skupia się na memach i treściach tanecznych. Oferuje aplikacje mobilne (iOS i Android) oraz platformę internetową (viggle.ai). Funkcje takie jak zamiana twarzy, animowanie zdjęć za pomocą ruchów tanecznych i wstawianie użytkowników do scen filmowych są już popularne wśród użytkowników Viggle, a teraz odkrywają oni nowe sposoby na podniesienie poziomu kreatywności.

Viggle testuje obecnie 2 funkcje wykorzystujące możliwości modeli Gemini 2.0 Flash i Imagen 3:


  • Obraz do wirtualnych postaci wideo: Viggle używa Imagen 3 do generowania obrazów, aby stworzyć kuźnię postaci opartą na AI. Użytkownicy mogą podawać proste prompty tekstowe, np. „tańczący robot ze świecącymi oczami” lub „puszysty, tęczowy smok”, a model wygeneruje unikalne wirtualne postacie gotowe do wystąpienia w ich filmach. Postacie te są następnie płynnie integrowane z silnikiem animacji Viggle, co otwiera świat spersonalizowanych możliwości opowiadania historii. Wyobraź sobie, że reżyserujesz własny animowany film krótkometrażowy z postaciami, które zrodziły się w Twojej wyobraźni – to właśnie możliwości, jakie dają Ci Viggle i Imagen 3.

  • Dynamiczna narracja AI: Viggle wykorzystuje też funkcję generowania mowy Gemini 2.0 Flash i jego zaawansowane rozumienie filmów, aby opracować funkcję, która dodaje do dowolnego filmu bogate w kontekst podkłady głosowe. To nie jest tylko monotonny głos czytający skrypt. To AI, która analizuje treść filmu, identyfikuje kluczowe momenty, działania, a nawet emocje, aby wygenerować narrację idealnie dopasowaną do obrazu. Niezależnie od tego, czy jest to humorystyczny komentarz do filmu z tańcem, czy epicki opis sceny fantasy, narrator AI dodaje zupełnie nowy wymiar zaangażowania.

Nowe możliwości kreatywności i zaangażowania

Integracja generatywnej AI może zwiększyć wygodę korzystania z Viggle na kilka sposobów:


  • Uproszczone tworzenie postaci: generowanie obrazów w Imagen 3 upraszcza proces tworzenia i dostosowywania postaci w filmach. Użytkownicy mogą teraz generować unikalne postacie na podstawie swoich pomysłów, co eliminuje potrzebę zaawansowanych umiejętności projektowania lub polegania na ograniczonych gotowych opcjach. Ten uproszczony proces umożliwia większej liczbie użytkowników realizowanie swoich kreatywnych wizji.

  • Bardziej spersonalizowane treści: Gemini 2.0 Flash umożliwia użytkownikom tworzenie wysoce spersonalizowanych narracji wideo. Specjalnie zaprojektowane postacie w połączeniu z dynamiczną narracją AI umożliwiają tworzenie wyjątkowych historii, które wzmacniają więź między twórcami a odbiorcami.

  • Większe możliwości twórcze: połączenie wirtualnych postaci i narracji AI zwiększa potencjał twórczy krótkich filmów w Viggle. Użytkownicy mogą odkrywać nowe formy opowiadania historii, wykraczając poza tradycyjne formaty wideo.

Co dalej

Viggle z radością będzie dalej badać potencjał Gemini 2.0 i modeli generowania obrazów, aby ulepszać swoją platformę. Firma wyobraża sobie przyszłość, w której AI będzie płynnie integrować się z każdym etapem procesu twórczego, umożliwiając każdemu tworzenie filmów.

„W Viggle każdy jest twórcą. Tworzymy memy, eksperymentujemy z technologią motion capture, aby realizować projekty na wyższym poziomie, i budujemy własne multiwersum. Dzięki realistycznym możliwościom narracji głosowej Gemini 2.0 Flash nasi użytkownicy zyskają nowe możliwości – będą mogli tworzyć historie jak nigdy dotąd”.

– Hang Chu, założyciel Viggle

Współpraca Viggle z Gemini 2.0 Flash i Imagen 3 pokazuje potencjał AI w zakresie przekształcania procesu tworzenia filmów i zapewniania użytkownikom nowych narzędzi do wyrażania siebie. Ta współpraca to krok w przyszłość opartą na AI. Aby dowiedzieć się więcej o tworzeniu aplikacji z użyciem Gemini, zapoznaj się z dokumentacją interfejsu Gemini API i przeczytaj więcej o Imagen 3, aby poznać nasze najnowsze osiągnięcia w zakresie generowania obrazów.