Ngày 16 tháng 5 năm 2025
Volley tạo ra các cuộc phiêu lưu nhập vai bằng AI thoại sống động với Gemini 2.5 và Veo 2

Volley tạo ra các cuộc phiêu lưu nhập vai bằng AI thoại sống động với Gemini 2.5 và Veo 2
Dựa trên nguyên mẫu "20 câu hỏi" thành công sử dụng công nghệ Flash của Gemini 2.0, Volley lại tiếp tục đẩy ranh giới của giải trí âm thanh tương tác bằng cách phát triển một trò chơi khám phá mê cung bằng AI thoại đầu tiên. Dự án mới này cho thấy cách tính năng tạo hình ảnh của Gemini 2.0 Flash và Veo 2 tạo ra hình ảnh tuyệt đẹp trong trò chơi, trong khi khả năng lập trình của Gemini 2.5 Pro Preview đang cách mạng hoá chính quá trình phát triển trò chơi, dẫn đến một cuộc phiêu lưu sống động chưa từng có.
Từ phần hỏi đáp nhanh đến cuộc phiêu lưu trực quan, phong phú
Volley đã thu hút hàng triệu người chơi bằng các trò chơi sử dụng giọng nói. Nguyên mẫu "20 câu hỏi" ban đầu của họ đã thể hiện tiềm năng của Gemini 2.5 Pro trong việc đưa ra câu trả lời nhanh như chớp và trò chuyện hai chiều hấp dẫn. Giờ đây, Volley đang nâng cao trải nghiệm khám phá mê cung động bằng cách khai thác bộ tính năng mạnh mẽ của Bản xem trước Gemini 2.5 Pro và mô hình tạo video Veo 2 của Google. Mục tiêu: một cuộc phiêu lưu tập trung vào âm thanh, trong đó mọi nhân vật tương tác đều do AI tạo ra, tạo ra hình ảnh phong phú trong trò chơi một cách linh động.
Tạo ra một thế giới mới của trò chơi điều khiển bằng giọng nói
Nguyên mẫu trò chơi khám phá mê cung đầy tham vọng này tận dụng các tiến bộ cụ thể của mô hình Gemini và Veo 2:
- Tạo hình nhân vật bằng AI thông qua Imagen 3: Cartwheel tích hợp các tính năng chuyển văn bản sang hình ảnh của Imagen 3, cho phép nhà sáng tạo sử dụng câu lệnh văn bản để hình thành ý tưởng và tạo hình ảnh nhân vật độc đáo ngay trong nền tảng. Bạn có thể tạo ảnh động cho các nhân vật được thiết kế tuỳ chỉnh này bằng ngôn ngữ tự nhiên, sau đó xuất toàn bộ cấu trúc và sẵn sàng sử dụng phần mềm chỉnh sửa 3D theo tiêu chuẩn ngành như Maya hoặc Blender, cho phép tích hợp vào môi trường sản xuất chuyên nghiệp.
-
Hỗ trợ hoạt động nghiên cứu và phát triển cũng như tối ưu hoá bằng bản dùng thử Gemini 2.5 Pro: Nhóm Cartwheel sử dụng bản dùng thử Gemini 2.5 Pro nội bộ để hỗ trợ quy trình làm việc về kỹ thuật và nghiên cứu:
- Tạo hình ảnh trò chơi động bằng Gemini 2.0 Flash và Veo 2: Để bổ sung cho trải nghiệm ưu tiên giọng nói, Volley đang tận dụng tính năng tạo hình ảnh của Gemini 2.0 Flash và sức mạnh của Veo 2 để tạo ra một chiều kích thước hình ảnh sống động. Các mục đích sử dụng bao gồm tạo hình minh hoạ ý tưởng, hình ảnh nhân vật, hình ảnh thiết lập cảnh động cho các vị trí và sự kiện chính, cũng như hình ảnh cho các vật phẩm và môi trường trong trò chơi, tất cả đều được thiết kế để giúp người chơi đắm chìm hơn.
- Tận dụng Bản dùng thử Gemini 2.5 Pro làm công cụ phát triển trò chơi: Volley đang sử dụng các khả năng lập trình và suy luận nâng cao của Bản dùng thử Gemini 2.5 Pro để đơn giản hoá và nâng cao quy trình phát triển. Điều này bao gồm việc tăng tốc việc viết và gỡ lỗi logic trò chơi và hệ thống nhiệm vụ, nhanh chóng tạo nguyên mẫu cơ chế trò chơi mới, đồng thời hỗ trợ tạo nội dung tường thuật cơ bản, điểm cốt truyện và cốt truyện nhân vật để nhóm phát triển xây dựng dựa trên đó.
Phát triển trò chơi nhập vai, ưu tiên giọng nói
Nguyên mẫu trò chơi khám phá mê cung mới này thể hiện tầm nhìn của Volley về những trò chơi dễ tiếp cận và mang lại trải nghiệm sống động bằng cách tận dụng AI. Dự án này nhằm khai thác những điểm mạnh được xác định trong nguyên mẫu "20 câu hỏi" – một luồng trò chuyện nhanh, giàu cảm xúc và tự nhiên – rồi áp dụng những điểm mạnh đó trong một cuộc phiêu lưu phức tạp hơn, được tăng cường hình ảnh.
Bằng cách sử dụng tính năng tạo hình ảnh Gemini 2.0 Flash và Veo 2 cho hình ảnh, cũng như Gemini 2.5 Pro Preview để hỗ trợ phát triển, Volley đang nỗ lực tạo ra một trò chơi mà câu chuyện được dẫn dắt bằng hoạt động tương tác bằng giọng nói, được tăng cường bằng hình ảnh phong phú.
Như Max Child, đồng sáng lập kiêm Giám đốc điều hành của Volley từng tuyên bố và điều này càng phù hợp hơn với nỗ lực mới này, "LLM và công nghệ nhận dạng giọng nói đang biến đổi trò chơi, thổi hồn vào trò chơi thông qua trải nghiệm tương tác, linh động. Nhờ đó, người chơi có thể đắm mình vào những cuộc phiêu lưu sống động, hấp dẫn, trong đó giọng nói của họ thực sự là yếu tố thúc đẩy câu chuyện". Trò chơi khám phá mê cung này, với các nội dung được tạo bằng AI, là minh chứng trực tiếp cho tầm nhìn đó, hứa hẹn một trò chơi mà mọi lời nói đều định hình con đường phía trước.
Làm quen với Gemini API: Tạo ra cuộc phiêu lưu của riêng bạn
Công việc tiên phong của Volley cho thấy tiềm năng của các mô hình AI của Google trong việc tạo ra trải nghiệm chơi trò chơi sáng tạo và hấp dẫn thế hệ mới. Nhà phát triển có thể khai thác sức mạnh của tính năng tạo hình ảnh của Gemini 2.0 Flash, Veo 2 để tạo video và hình ảnh tuyệt đẹp, cũng như Gemini 2.5 Pro Preview để hỗ trợ lập trình nâng cao và nội dung, nhằm xây dựng thế giới tương tác của riêng họ.
Bạn đã sẵn sàng tạo ứng dụng chưa? Khám phá tài liệu về Gemini API và bắt đầu sử dụng Google AI Studio ngay hôm nay.
Volley là một thành viên tham gia Quỹ tương lai về AI của Google. Quỹ này đầu tư và cộng tác với các công ty khởi nghiệp đầy tham vọng để xây dựng những công nghệ AI tiếp theo.