แชร์

16 พฤษภาคม 2025

Cartwheel พัฒนาภาพเคลื่อนไหวตัวละครโดยใช้ Gemini API

Jonathan Jarvis

ผู้ร่วมก่อตั้งและ CTO

Andrew Carr

ผู้ร่วมก่อตั้งและหัวหน้านักวิทยาศาสตร์

Vishal Dharmadhikari

AI DevRel

ฮีโร่ของ Cartwheel Showcase

Cartwheel พัฒนาภาพเคลื่อนไหวตัวละครโดยใช้ Gemini API

Cartwheel อยู่แถวหน้าของแอนิเมชันรุ่นถัดไป โดยมีแพลตฟอร์มที่รับอินพุตภาษาธรรมชาติ (เช่น "กระโดด" "หมุนตัวเต้นซัลซ่า") การกระทำของตัวละครโดยตรง นวัตกรรมนี้ช่วยปรับปรุงวิธีที่ครีเอเตอร์สร้างภาพเคลื่อนไหวสำหรับวิดีโอ เกม การโฆษณา และโซเชียลมีเดีย Cartwheel ผสานรวม Imagen 3 เพื่อการออกแบบข้อความเป็นตัวละครที่ใช้งานง่าย และใช้ประโยชน์จาก Gemini 2.5 Pro เวอร์ชันตัวอย่างเพื่อพัฒนาอัลกอริทึมที่ซับซ้อนเฉพาะสำหรับการสร้างภาพเคลื่อนไหว สำรวจฐานของโค้ดที่ซับซ้อน และเร่งการเพิ่มประสิทธิภาพแพลตฟอร์ม ซึ่งช่วยให้ผู้ใช้ขยายการเล่าเรื่องอย่างสร้างสรรค์ได้

การเอาชนะอุปสรรคด้านการวิจัยและพัฒนาในการเคลื่อนไหวแบบ 3 มิติด้วย Generative AI

การพัฒนาแพลตฟอร์มภาพเคลื่อนไหวที่ล้ำสมัยไม่เพียงต้องมีเครื่องมือออกแบบที่ใช้งานง่าย แต่ยังต้องมีการสร้างสรรค์นวัตกรรมอย่างต่อเนื่องในอัลกอริทึมแบ็กเอนด์และการจัดการโค้ดเบสที่มีประสิทธิภาพด้วย Cartwheel พบกับความท้าทายในการสร้างต้นแบบอย่างรวดเร็วและการใช้ฟีเจอร์ภาพเคลื่อนไหวที่ซับซ้อน การเพิ่มประสิทธิภาพโค้ดเบสขนาดใหญ่เพื่อประสิทธิภาพ และการช่วยให้นักพัฒนาแอปเข้าใจและมีส่วนร่วมในระบบขนาดใหญ่ได้อย่างรวดเร็ว ทีมต้องการพาร์ทเนอร์ AI ที่มีประสิทธิภาพเพื่อเพิ่มความพยายามในการพัฒนา

วิธีที่ Cartwheel ใช้ Imagen 3 และ Gemini 2.5 Pro เวอร์ชันตัวอย่าง

Cartwheel ใช้ Gemini API เพื่อปรับปรุงไปป์ไลน์การสร้างที่ผู้ใช้มองเห็นและเพื่อช่วยกระบวนการพัฒนาภายใน

  • การสร้างตัวละครที่ขับเคลื่อนด้วย AI ด้วย Imagen 3: Cartwheel ผสานรวมความสามารถในการแปลงข้อความเป็นรูปภาพของ Imagen 3 ซึ่งช่วยให้ครีเอเตอร์ใช้พรอมต์ข้อความเพื่อสร้างแนวคิดและสร้างภาพตัวละครที่ไม่ซ้ำใครได้โดยตรงภายในแพลตฟอร์ม คุณสามารถสร้างภาพเคลื่อนไหวของตัวละครที่ออกแบบมาโดยเฉพาะเหล่านี้ได้โดยใช้ภาษาธรรมชาติ จากนั้นส่งออกตัวละครที่ผ่านการปรับแต่งอย่างเต็มรูปแบบและพร้อมใช้งานกับซอฟต์แวร์แก้ไข 3 มิติมาตรฐานอุตสาหกรรม เช่น Maya หรือ Blender ซึ่งช่วยให้ผสานรวมเข้ากับสภาพแวดล้อมการผลิตระดับมืออาชีพได้
  • การช่วยเหลือด้านการวิจัยและพัฒนาและการเพิ่มประสิทธิภาพด้วย Gemini 2.5 Pro เวอร์ชันตัวอย่าง: ทีม Cartwheel ใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่างภายในเพื่อสนับสนุนเวิร์กโฟลว์ด้านวิศวกรรมและการวิจัย
    • การพัฒนาอัลกอริทึม: เราใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่างเพื่อช่วยพัฒนาฟีเจอร์เฉพาะสำหรับภาพเคลื่อนไหว ซึ่งรวมถึงอัลกอริทึมสำหรับโมชันเบลอสำหรับการสังเคราะห์ข้อมูล, พีระมิดลาปลาซสำหรับการผสมผสาน และ IK อัตโนมัติ (Inverse Kinematics) สำหรับการวางท่าในเอดิเตอร์
    • การสำรวจและการแก้ไขข้อบกพร่องของโค้ด: ทีมใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่างเพื่อสำรวจฐานของโค้ดที่ซับซ้อน สร้างไอเดียสำหรับการทดลองใหม่ๆ และช่วยในการแก้ไขข้อบกพร่องของกรณีที่ซับซ้อนได้อย่างมีประสิทธิภาพ เช่น ข้อผิดพลาดในการหมุนกล้องที่ซับซ้อน
    • ใช้ประโยชน์จากบริบทแบบยาวสำหรับการดำเนินการในโค้ดเบส: ความสามารถด้านบริบทแบบยาวของ Gemini 2.5 Pro เวอร์ชันตัวอย่างใช้ในการดำเนินการในโค้ดเบสทั้งหมดของ Cartwheel ซึ่งจะช่วยให้นักพัฒนาซอฟต์แวร์นำโค้ดเบสใหม่ๆ (เช่น ฟรอนต์เอนด์) มาใช้ในบริบทเพื่อช่วยเพิ่มฟีเจอร์หรือถามคำถามระดับสูงเกี่ยวกับสถาปัตยกรรมและฟังก์ชันการทำงานของระบบได้

เพิ่มประสิทธิภาพเวิร์กโฟลว์ภาพเคลื่อนไหว

การใช้ Gemini 2.5 Pro เวอร์ชันตัวอย่างเพื่อช่วยในการพัฒนาอัลกอริทึม การสำรวจโค้ด และการแก้ไขข้อบกพร่องมีเป้าหมายเพื่อปรับปรุงกระบวนการพัฒนาและเร่งการเพิ่มประสิทธิภาพแพลตฟอร์ม การผสานรวม Imagen 3 ช่วยให้ผู้ใช้สร้างภาพตัวละครจากข้อความได้อย่างมีประสิทธิภาพ ขณะที่ Gemini 2.5 Pro เวอร์ชันตัวอย่างทำหน้าที่เป็นเครื่องมือช่วยเหลือนักพัฒนาซอฟต์แวร์ในการสร้างเทคโนโลยีพื้นฐาน การผสานรวมเหล่านี้รองรับเป้าหมายของ Cartwheel ในการทำให้เวิร์กโฟลว์ของภาพเคลื่อนไหวเร็วขึ้นและเข้าถึงได้มากขึ้น ซึ่งช่วยให้ใช้ประโยชน์ได้ดังนี้

  • เร่งการสร้างชิ้นงานสำหรับเกมและวิดีโอ เพื่อให้ทีมมุ่งเน้นไปที่การออกแบบหลัก
  • ช่วยให้การตลาดและการสร้างเนื้อหาโซเชียลมีเดียมีประสิทธิภาพ

"ภาพเคลื่อนไหวเป็นวิธีที่บริสุทธิ์ที่สุดวิธีหนึ่งในการนำเรื่องราวออกจากหัวของคุณและแสดงให้โลกเห็น เรากำลังสร้างเครื่องมือที่จะช่วยให้ทุกคนเข้าถึงและใช้งานได้ง่ายขึ้น"

- Jonathan Jarvis, CEO / ผู้ร่วมก่อตั้ง Cartwheel

สร้างอนาคตของแอนิเมชัน

การผสานรวม Imagen 3 และ Gemini 2.5 Pro เวอร์ชันตัวอย่างของ Cartwheel แสดงให้เห็นว่า Google AI สามารถนำไปใช้เพื่อเปิดตัวฟีเจอร์ใหม่ๆ ที่ผู้ใช้มองเห็นและช่วยงานพัฒนาที่ซับซ้อนซึ่งจำเป็นต่อการสร้างเครื่องมือรุ่นถัดไปได้อย่างไร

สำรวจเอกสารประกอบเกี่ยวกับ Gemini API ดูข้อมูลเกี่ยวกับ Imagen 3 และเริ่มต้นใช้งานใน Google AI Studio

Cartwheel เป็นผู้เข้าร่วมใน AI Futures Fund ของ Google ซึ่งลงทุนและทำงานร่วมกับสตาร์ทอัพที่มีความมุ่งมั่นในการสร้างสรรค์สิ่งใหม่ๆ ใน AI