2025 年 5 月 16 日
Volley 利用 Gemini 2.5 和 Veo 2 打造沉浸式语音 AI 地下城冒险游戏

Volley 利用 Gemini 2.5 和 Veo 2 打造沉浸式语音 AI 地下城冒险
在成功推出 Gemini 2.0 Flash 赋能的“20 个问题”原型的基础上,Volley 又开发了一款首创的语音 AI 地下城探索游戏,再次突破了互动式音频娱乐的边界。这项新合作展示了 Gemini 2.0 Flash 的图片生成功能和 Veo 2 如何生成令人惊叹的游戏内视觉效果,同时 Gemini 2.5 Pro 预览版的编码功能如何彻底改变游戏开发流程,最终打造出无与伦比的沉浸式冒险体验。
从快节奏问答到丰富的视觉冒险
Volley 以其语音游戏吸引了数百万人。他们最初的“20 个问题”原型展示了 Gemini 2.5 Pro 能够极速响应并进行富有吸引力的互动对话。现在,Volley 利用强大的 Gemini 2.5 Pro 预览功能套件和 Google 的 Veo 2 视频生成模型,提升了动态地下城探索游戏体验。目标:打造以音频为先的冒险游戏,其中每个互动角色均由 AI 生成,动态创建丰富的游戏内视觉效果。
开创语音控制游戏的新领域
这款雄心勃勃的地下城探索游戏原型利用了特定的 Gemini 模型和 Veo 2 方面的进步:
- 利用 Imagen 3 实现 AI 赋能的角色构思:Cartwheel 集成了 Imagen 3 文本到图片功能,让创作者可以使用文本提示直接在平台内构思和生成独特的角色视觉效果。这些自定义角色可以使用自然语言进行动画处理,然后导出为完全绑定好的角色,以便在 Maya 或 Blender 等业界标准 3D 编辑软件中使用,从而集成到专业的制作环境中。
-
利用 Gemini 2.5 Pro 预览版协助开展研发和优化工作:Cartwheel 团队在内部使用 Gemini 2.5 Pro 预览版来支持其工程和研究工作流:
- 使用 Gemini 2.0 Flash 和 Veo 2 生成动态游戏画面:为了完善以语音为主的体验,Volley 利用 Gemini 2.0 Flash 的图片生成功能和 Veo 2 的强大能力,打造出生动活泼的视觉维度。用途包括生成概念艺术、角色视觉效果、关键地点和活动的动态场景设置图片,以及游戏内物品和环境的图像,所有这些都旨在加深玩家的沉浸感。
- 将 Gemini 2.5 Pro 预览版用作游戏开发工具:Volley 利用 Gemini 2.5 Pro 预览版的先进推理和编码功能,简化并改进了开发流程。这包括加快游戏逻辑和任务系统的编写和调试速度、快速对新游戏机制进行原型设计,以及协助生成基础叙事内容、情节要点和角色背景故事,以供开发团队据之构建。
不断演进的以语音为先的沉浸式游戏
这款全新的地下城探索游戏原型体现了 Volley 的愿景,即利用 AI 技术打造简单易玩且沉浸感十足的游戏。该项目旨在利用“20 个问题”原型中确定的优势(即快速、富有情感且自然的对话流程),并将其应用于更复杂、视觉效果更出色的冒险体验中。
通过使用 Gemini 2.0 Flash 图片生成功能和 Veo 2 来处理视觉效果,并使用 Gemini 2.5 Pro 预览版来协助开发,Volley 正致力于打造一款以语音互动推动故事情节发展,并辅以丰富视觉效果的游戏。
正如 Volley 联合创始人兼首席执行官 Max Child 之前所说(这句话与这项新计划更加契合):“LLM 和语音识别技术正在改变游戏,通过动态互动体验为游戏注入活力。让玩家能够沉浸在生动有趣的冒险中,并通过自己的声音真正推动故事的发展。”这款采用 AI 赋能的地下城探索游戏正是这一愿景的直接体现,它承诺打造一个游戏,让玩家所说的每一句话都将影响前进的道路。
Gemini API 使用入门:开启您的冒险之旅
Volley 的开创性工作展示了 Google AI 模型在打造新一代创新且富有吸引力的游戏体验方面的潜力。开发者可以利用 Gemini 2.0 Flash 的图片生成功能、Veo 2 生成令人惊艳的视频和图片,以及 Gemini 2.5 Pro Preview 提供的高级编码和内容协助功能,构建自己的互动世界。
准备好构建了吗?立即探索 Gemini API 文档,并开始使用 Google AI Studio。
Volley 是 Google AI Futures Fund 的参与者,该基金会投资于雄心勃勃的初创公司,并与其合作,共同打造 AI 领域的未来技术。