Teilen

16. Mai 2025

Cartwheel nutzt die Gemini API für fortschrittliche Charakteranimation

Jonathan Jarvis

Mitgründer und CTO

Andrew Carr

Mitbegründer und Chief Scientist

Vishal Dharmadhikari

AI DevRel

Hero-Image für Cartwheel-Showcase

Cartwheel nutzt die Gemini API für fortschrittliche Charakteranimation

Cartwheel steht an der Spitze der Animation der nächsten Generation und bietet eine Plattform, auf der natürliche Spracheingaben (z.B. „springen“, „Salsa tanzen“), um Charakteraktionen auszuführen. Diese Innovation verbessert die Animationen von Creatorn für Videos, Gaming, Werbung und soziale Medien. Cartwheel integriert Imagen 3 für ein intuitives Design von Text zu Charakteren und nutzt Gemini 2.5 Pro Preview, um ausgefeilte animationspezifische Algorithmen zu entwickeln, komplexe Codebases zu untersuchen und die Plattformoptimierung zu beschleunigen. So können Nutzer ihre kreativen Geschichten ausweiten.

Herausforderungen bei der Forschung und Entwicklung in der generativen 3D-Bewegung meistern

Die Entwicklung einer innovativen Animationsplattform erfordert nicht nur nutzerfreundliche Designtools, sondern auch kontinuierliche Innovationen bei den Backend-Algorithmen und eine effiziente Codebasisverwaltung. Cartwheel stand vor der Herausforderung, schnell Prototypen für komplexe Animationsfunktionen zu erstellen und zu implementieren, die umfangreiche Codebasis für die Leistung zu optimieren und Entwicklern zu ermöglichen, ein groß angelegtes System schnell zu verstehen und dazu beizutragen. Sie benötigten einen leistungsstarken KI-Partner, um ihre Entwicklungsbemühungen zu beschleunigen.

So verwendet Cartwheel Imagen 3 und Gemini 2.5 Pro (Vorabversion)

Cartwheel verwendet die Gemini API, um die Erstellungspipeline für Nutzer zu verbessern und die internen Entwicklungsabläufe zu unterstützen.

  • KI-gestützte Charakterkonzeption mit Imagen 3:Cartwheel bietet die Text-zu-Bild-Funktionen von Imagen 3. So können Creator mithilfe von Textprompts direkt auf der Plattform einzigartige Charaktervisualisierungen entwerfen und generieren. Diese benutzerdefinierten Charaktere können mit natürlicher Sprache animiert und dann vollständig gerüstet und für die branchenübliche 3D-Bearbeitungssoftware wie Maya oder Blender exportiert werden. So können sie in professionelle Produktionsumgebungen eingebunden werden.
  • Unterstützung bei Forschung und Entwicklung sowie Optimierung mit Gemini 2.5 Pro Preview:Das Cartwheel-Team verwendet Gemini 2.5 Pro Preview intern, um seine Entwicklungs- und Rechercheabläufe zu unterstützen:
    • Entwicklung von Algorithmen:Gemini 2.5 Pro Preview wird bei der Entwicklung von animationsspezifischen Funktionen eingesetzt, darunter Algorithmen für Bewegungsunschärfe bei der Datensynthese, Laplacian-Pyramiden für das Mischen und automatische IK (Inverse Kinematik) für das Posieren im Editor.
    • Code-Exploration und Debugging:Das Team verwendet Gemini 2.5 Pro Preview, um komplexe Codebases zu untersuchen, Ideen für neue Tests zu entwickeln und bei der effizienten Fehlerbehebung bei Grenzfällen wie komplizierten Kameradrehfehlern zu helfen.
    • Langer Kontext für Codebase-Vorgänge nutzen:Die Funktionen für den langen Kontext in der Gemini 2.5 Pro-Vorabversion werden für die gesamte Codebasis von Cartwheel verwendet. So können Entwickler beispielsweise neue Codebases (z. B. das Front-End) in einen Kontext stellen, um Funktionen hinzuzufügen oder allgemeine Fragen zur Architektur und Funktionalität des Systems zu stellen.

Animation Workflows optimieren

Mit der Gemini 2.5 Pro-Vorabversion möchte Cartwheel seine Entwicklungsabläufe optimieren und die Plattformoptimierung beschleunigen. Die Einbindung von Imagen 3 bietet Nutzern eine optimierte Möglichkeit, Charaktervisualisierungen aus Text zu generieren. Gemini 2.5 Pro Preview dient als Tool, um Entwicklern bei der Entwicklung der zugrunde liegenden Technologie zu helfen. Diese Integrationen unterstützen das Ziel von Cartwheel, Animation Workflows schneller und barrierefreier zu gestalten. So sind unter anderem folgende Anwendungsfälle möglich:

  • Die Asset-Erstellung für Spiele und Videos wird beschleunigt, sodass sich die Teams auf das Kerndesign konzentrieren können.
  • Ermöglicht die effiziente Erstellung von Marketing- und Social-Media-Inhalten.

„Animation ist eine der reinsten Möglichkeiten, eine Geschichte aus dem Kopf zu holen und der Welt zu zeigen. Wir entwickeln Tools, die das für alle einfacher und zugänglicher machen.“

– Jonathan Jarvis, CEO / Mitgründer, Cartwheel

Die Zukunft der Animation

Die Integration von Imagen 3 und Gemini 2.5 Pro in Cartwheel zeigt, wie Google AI eingesetzt werden kann, um neue nutzerorientierte Funktionen zu ermöglichen und die komplexe Entwicklungsarbeit für die Erstellung von Tools der nächsten Generation zu unterstützen.

Lesen Sie die Dokumentation zur Gemini API, informieren Sie sich über Bild 3 und beginnen Sie mit Google AI Studio.

Cartwheel ist Teil des AI Futures Fund von Google, der in ehrgeizige Start-ups investiert und mit ihnen zusammenarbeitet, um die Zukunft der KI zu gestalten.