2025 年 5 月 16 日
Cartwheel 使用 Gemini API 改进了角色动画

Cartwheel 使用 Gemini API 改进了角色动画
Cartwheel 处于下一代动画技术的前沿,提供一个平台,可让自然语言输入(例如“跳跃”“莎莎舞旋转”)来指挥角色的动作。这项创新技术可以帮助创作者改进视频、游戏、广告和社交媒体的动画效果。Cartwheel 集成了 Imagen 3,可实现直观的文本转字符设计,并利用 Gemini 2.5 Pro 预览版开发复杂的动画专用算法、探索复杂的代码库并加快平台优化速度,让用户能够拓展其富有创意的讲故事方式。
克服生成式 3D 动画的研发障碍
开发一款尖端动画平台不仅需要人性化的设计工具,还需要在后端算法和高效代码库管理方面不断创新。Cartwheel 面临着快速设计原型并实现复杂动画功能、优化其庞大的代码库以提升性能,以及让开发者能够快速了解大型系统并为其做出贡献的挑战。他们需要强大的 AI 合作伙伴,以便加速开发工作。
Cartwheel 如何使用 Imagen 3 和 Gemini 2.5 Pro 预览版
Cartwheel 使用 Gemini API 改进面向用户的制作流水线,并协助其内部开发流程。
- 利用 Imagen 3 实现 AI 赋能的角色构思:Cartwheel 集成了 Imagen 3 文本到图片功能,让创作者可以使用文本提示直接在平台内构思和生成独特的角色视觉效果。这些自定义角色可以使用自然语言进行动画处理,然后导出为完全绑定好的角色,以便在 Maya 或 Blender 等业界标准 3D 编辑软件中使用,从而集成到专业的制作环境中。
-
利用 Gemini 2.5 Pro 预览版协助开展研发和优化工作:Cartwheel 团队在内部使用 Gemini 2.5 Pro 预览版来支持其工程和研究工作流:
- 开发算法:Gemini 2.5 Pro 预览版可帮助开发动画专用功能,包括用于数据合成的运动模糊算法、用于混合的拉普拉斯金字塔算法,以及用于编辑器内姿势的自动 IK(反向运动学)算法。
- 代码探索和调试:该团队使用 Gemini 2.5 Pro 预览版探索复杂的代码库、为新实验生成想法,并协助高效调试极端情况(例如复杂的相机旋转错误)。
- 利用长上下文进行代码库操作:Gemini 2.5 Pro 预览版的长上下文功能用于对 Cartwheel 的整个代码库进行操作。例如,开发者可以将新的代码库(例如前端)纳入上下文,以帮助添加功能或提出有关系统架构和功能的概要问题。
赋能动画工作流
Cartwheel 希望通过使用 Gemini 2.5 Pro 预览版来协助算法开发、代码探索和调试,从而改进其开发流程并加快平台优化速度。集成 Imagen 3 为用户提供了一种简化的方式,可根据文本生成角色视觉效果,而 Gemini 2.5 Pro 预览版则可作为一种工具,帮助开发者构建底层技术。这些集成有助于实现 Cartwheel 的目标,即让动画工作流更快捷、更易用,从而实现以下用途:
- 加快游戏和视频的素材资源制作速度,让团队能够专注于核心设计。
- 助力高效制作营销和社交媒体内容。
动画是将想象中的故事呈现给世界的一个纯粹方式。我们正在开发各种工具,让所有人都能更轻松地使用这些功能!”
构建动画的未来
Cartwheel 将 Imagen 3 与 Gemini 2.5 Pro 预览版集成,突出展示了如何运用 Google AI 来实现面向用户的新功能,并协助完成构建新一代工具所需的复杂开发工作。
浏览 Gemini API 文档,了解 Imagen 3,并在 Google AI Studio 中开始使用。
Cartwheel 是 Google AI Futures Fund 的参与者,该基金会投资于雄心勃勃的初创公司,并与其合作,共同打造 AI 领域的未来技术。