16 maja 2025 r.
Cartwheel ulepsza animację postaci za pomocą interfejsu Gemini API

Cartwheel ulepsza animację postaci za pomocą interfejsu Gemini API
Cartwheel to platforma animacji nowej generacji, która umożliwia tworzenie animacji na podstawie danych wejściowych w języku naturalnym (np. „skok”, „obrót w salsie”) bezpośrednie działania postaci. To innowacyjne rozwiązanie usprawnia tworzenie animacji do filmów, gier, reklam i mediów społecznościowych. Cartwheel integruje Imagen 3, aby umożliwić intuicyjne projektowanie postaci na podstawie tekstu, oraz wykorzystuje Gemini 2.5 Pro w wersji testowej do opracowywania zaawansowanych algorytmów związanych z animacją, eksplorowania złożonych baz kodu i przyspieszania optymalizacji platformy, co pozwala użytkownikom rozwijać kreatywne opowiadanie historii.
Pokonywanie przeszkód w badaniach i rozwoju w zakresie generatywnego ruchu 3D
Opracowanie nowoczesnej platformy do animacji wymaga nie tylko przyjaznych dla użytkownika narzędzi do projektowania, ale także ciągłych innowacji w algorytmach backendu i wydajnego zarządzania bazą kodu. Zespół Cartwheel musiał szybko tworzyć prototypy i wdrażać złożone funkcje animacji, optymalizować obszerny kod pod kątem wydajności oraz umożliwiać programistom szybkie zrozumienie systemu na dużą skalę i współtworzenie go. Potrzebowali zaawansowanego partnera AI, który usprawni ich działania w zakresie rozwoju.
Jak Cartwheel korzysta z Imagen 3 i wersji testowej Gemini 2.5 Pro
Cartwheel używa interfejsu Gemini API do ulepszania procesu tworzenia treści dla użytkowników i wspomagania wewnętrznych procesów programistycznych.
- Tworzenie postaci z użyciem AI w Imagen 3: Cartwheel integruje funkcje zamiany tekstu na obraz Imagen 3, dzięki czemu twórcy mogą używać promptów tekstowych do tworzenia i generowania unikalnych wizualizacji postaci bezpośrednio na platformie. Te zaprojektowane przez użytkownika postacie można animować za pomocą języka naturalnego, a następnie eksportować w pełni przygotowane do użycia w standardowym oprogramowaniu do edycji 3D, takim jak Maya czy Blender, co umożliwia integrację z profesjonalnymi środowiskami produkcyjnymi.
-
Wspomaganie prac badawczo-rozwojowych i optymalizacji dzięki wersji podglądowej Gemini 2.5 Pro: zespół Cartwheel używa wewnętrznie wersji podglądowej Gemini 2.5 Pro do obsługi procesów inżynieryjnych i badawczych:
- Opracowywanie algorytmów: wersja testowa Gemini 2.5 Pro jest używana do opracowywania funkcji specyficznych dla animacji, w tym algorytmów rozmycia ruchu na potrzeby syntezy danych, piramid laplasowskich do mieszania i automatycznej kinematyki odwrotnej (IK) do pozowania w edytorze.
- Eksploracja i debugowanie kodu: zespół korzysta z wersji testowej Gemini 2.5 Pro, aby eksplorować złożone bazy kodu, generować pomysły na nowe eksperymenty i skutecznie debugować przypadki brzegowe, takie jak skomplikowane błędy rotacji kamery.
- Wykorzystanie długiego okna kontekstu do operacji na bazie kodu: możliwości długiego okna kontekstu w wersji testowej Gemini 2.5 Pro są wykorzystywane do obsługi całej bazy kodu Cartwheel. Dzięki temu deweloperzy mogą na przykład wprowadzać nowe bazy kodu (takie jak frontend) w kontekście, aby ułatwić dodawanie funkcji lub zadawanie ogólnych pytań dotyczących architektury i funkcjonalności systemu.
Ulepszanie przepływów pracy związanych z animacją
Korzystając z wersji podglądowej Gemini 2.5 Pro do pomocy w opracowywaniu algorytmów, eksplorowaniu kodu i debugowaniu, Cartwheel chce ulepszyć procesy programistyczne i przyspieszyć optymalizację platformy. Integracja z Imagen 3 zapewnia użytkownikom prosty sposób generowania obrazów postaci na podstawie tekstu, a wersja testowa Gemini 2.5 Pro służy jako narzędzie wspomagające pracę deweloperów tworzących technologię bazową. Integracje te wspierają cele Cartwheel, czyli przyspieszanie i ułatwianie przepływów pracy związanych z animacją, umożliwiając takie zastosowania jak:
- Przyspieszenie tworzenia zasobów do gier i filmów, dzięki czemu zespoły mogą skupić się na podstawowym projekcie.
- ułatwianie sprawnego generowania treści marketingowych i treści do mediów społecznościowych;
„Animacja to jeden z najczystszych sposobów na to, by wydobyć z głowy historię i pokazać ją światu. Tworzymy narzędzia, które ułatwiają i umożliwiają to wszystkim użytkownikom”.
Budowanie przyszłości animacji
Integracja Cartwheel z wersją testową modeli Imagen 3 i Gemini 2.5 Pro pokazuje, jak można wykorzystać AI od Google do tworzenia nowych funkcji dla użytkowników i wspierania złożonych prac programistycznych wymaganych do budowania narzędzi nowej generacji.
Zapoznaj się z dokumentacją interfejsu Gemini API, dowiedz się więcej o Imagen 3 i zacznij korzystać z Google AI Studio.
Cartwheel uczestniczy w programie Google AI Futures Fund, który inwestuje w ambitne startupy tworzące przyszłość AI i z nimi współpracuje.