แชร์

11 ธ.ค. 2024

พลิกโฉมการสร้างวิดีโอด้วย Gemini 2.0 Flash

Vishal Dharmadhikari

วิศวกรโซลูชันผลิตภัณฑ์

Hang Chu

Viggle

รูปภาพหลักของ Viggle Showcase

Gemini API ไม่ได้แค่ปรับปรุงแอป แต่ยังจุดประกายการปฏิวัติการแสดงออกอย่างสร้างสรรค์ด้วย Viggle ซึ่งเป็นแอปวิดีโอ AI ที่กำลังมาแรงและช่วยให้ทุกคนเปลี่ยนรูปภาพเป็นภาพเคลื่อนไหวที่น่าสนใจได้เป็นผู้นำในการปฏิวัติครั้งนี้ การทดลองใช้ความมหัศจรรย์แบบมัลติโมดัลของ Gemini 2.0 Flash ซึ่งปัจจุบันพร้อมให้บริการในเวอร์ชันทดลองเท่านั้น โดยเฉพาะความสามารถในการทำความเข้าใจวิดีโอขั้นสูงและเอาต์พุตเสียงควบคู่ไปกับการสร้างรูปภาพโดย Imagen 3 ทำให้ Viggle กำลังสร้างฟีเจอร์ที่จะช่วยให้ผู้ใช้สามารถเปลี่ยนจินตนาการที่แปลกประหลาดที่สุดให้กลายเป็นจริงได้อย่างง่ายดายในแบบที่ไม่เคยมีมาก่อน

เบื้องหลัง Viggle: ขับเคลื่อนการสร้างวิดีโอ AI ด้วย Gemini 2.0 Flash และ Imagen 3

Viggle ได้ดึงดูดผู้ใช้หลายล้านคนด้วยความสามารถในการเปลี่ยนรูปภาพนิ่งให้เป็นวิดีโอเคลื่อนไหวที่มีการเคลื่อนไหวทั้งตัวได้อย่างง่ายดาย ซึ่งจุดประกายให้เกิดเนื้อหาไวรัลในแพลตฟอร์มโซเชียลมีเดียต่างๆ Viggle มุ่งเน้นที่เนื้อหาเกี่ยวกับมุกตลกและเนื้อหาการเต้น โดยมีแอปบนอุปกรณ์เคลื่อนที่ (iOS และ Android) และแพลตฟอร์มเว็บ (viggle.ai) ฟีเจอร์ต่างๆ เช่น การสลับใบหน้า การทำให้รูปภาพเคลื่อนไหวด้วยท่าเต้น และการแทรกผู้ใช้ลงในฉากภาพยนตร์ได้รับความนิยมในฐานผู้ใช้ของ Viggle อยู่แล้ว และตอนนี้ Viggle กำลังหาวิธีใหม่ๆ ในการยกระดับความคิดสร้างสรรค์ไปอีกขั้น

ตอนนี้ Viggle กำลังสร้างต้นแบบฟีเจอร์ 2 อย่างที่ใช้ประโยชน์จากพลังของ Gemini 2.0 Flash และ Imagen 3 ดังนี้


  • เปลี่ยนรูปภาพเป็นตัวละครวิดีโอเสมือน: Viggle ใช้ Imagen 3 ในการสร้างรูปภาพเพื่อสร้างโรงหล่อตัวละครที่ทำงานด้วยระบบ AI ผู้ใช้สามารถป้อนพรอมต์ข้อความง่ายๆ เช่น "หุ่นยนต์เต้นรำที่มีดวงตาเรืองแสง" หรือ "มังกรขนปุยสีรุ้ง" แล้วโมเดลจะสร้างตัวละครเสมือนที่ไม่ซ้ำใครพร้อมให้ผู้ใช้จับไปแสดงในวิดีโอ จากนั้นระบบจะผสานรวมตัวละครเหล่านี้เข้ากับเอนจินภาพเคลื่อนไหวของ Viggle อย่างราบรื่น ซึ่งจะเปิดจักรวาลแห่งความเป็นไปได้ในการเล่าเรื่องที่ปรับเปลี่ยนในแบบของคุณ ลองนึกภาพการกำกับภาพยนตร์สั้นแบบเคลื่อนไหวของคุณเองโดยมีตัวละครที่เกิดจากจินตนาการของคุณทั้งหมด นั่นคือพลังที่ Viggle และ Imagen 3 มอบให้คุณ

  • คำบรรยาย AI แบบไดนามิก: Viggle ยังใช้ความสามารถของ Gemini 2.0 Flash ในการสร้างคำพูดและความเข้าใจวิดีโออย่างลึกซึ้งเพื่อพัฒนาฟีเจอร์ที่เพิ่มเสียงบรรยายที่อิงตามบริบทลงในวิดีโอใดก็ได้ นี่ไม่ใช่แค่เสียงพูดที่อ่านสคริปต์เท่านั้น แต่เป็นผู้เล่าเรื่องโดย AI ที่วิเคราะห์เนื้อหาของวิดีโอ โดยจะระบุช่วงเวลาสำคัญ การกระทำ และแม้แต่อารมณ์ เพื่อสร้างคำบรรยายที่เข้ากันได้ดีกับภาพ ไม่ว่าจะเป็นการแสดงความคิดเห็นแบบขำๆ ในวิดีโอการเต้นหรือคำอธิบายสุดอลังการของฉากแฟนตาซี ผู้บรรยาย AI จะช่วยเพิ่มมิติใหม่ๆ ในการมีส่วนร่วม

ปลดล็อกความคิดสร้างสรรค์และการมีส่วนร่วมไปอีกขั้น

การผสานรวม Generative AI พร้อมที่จะปรับปรุงประสบการณ์การใช้งาน Viggle ในหลายๆ ด้านที่สำคัญ ดังนี้


  • การสร้างตัวละครที่ง่ายขึ้น: การสร้างรูปภาพของ Imagen 3 ช่วยเพิ่มประสิทธิภาพกระบวนการสร้างและปรับแต่งตัวละครในวิดีโอ ตอนนี้ผู้ใช้สามารถสร้างตัวละครที่ไม่ซ้ำใครตามไอเดียของตนเองได้แล้ว โดยไม่ต้องมีทักษะการออกแบบขั้นสูงหรือพึ่งพาตัวเลือกที่กำหนดไว้ล่วงหน้าแบบจำกัด เวิร์กโฟลว์ที่เรียบง่ายนี้ช่วยให้ผู้ใช้จำนวนมากขึ้นสามารถสร้างสรรค์วิสัยทัศน์เชิงสร้างสรรค์ของตนให้เป็นจริงได้

  • เนื้อหาที่ปรับเปลี่ยนในแบบของคุณมากขึ้น: Gemini 2.0 Flash ช่วยให้ผู้ใช้สร้างเรื่องราวในวิดีโอที่ปรับเปลี่ยนในแบบของคุณได้อย่างมาก ตัวละครที่ออกแบบมาโดยเฉพาะเมื่อรวมกับการบรรยายด้วย AI แบบไดนามิกจะช่วยให้ครีเอเตอร์เล่าเรื่องราวที่ไม่เหมือนใครซึ่งจะช่วยกระชับความสัมพันธ์ระหว่างครีเอเตอร์กับผู้ชม

  • ความเป็นไปได้ด้านครีเอทีฟโฆษณาที่เพิ่มขึ้น: การผสมผสานตัวละครเสมือนจริงและการบรรยายด้วย AI จะช่วยขยายศักยภาพด้านครีเอทีฟโฆษณาของวิดีโอแบบสั้นบน Viggle ผู้ใช้สามารถสำรวจรูปแบบการเล่าเรื่องใหม่ๆ ที่นอกเหนือไปจากรูปแบบวิดีโอดั้งเดิม

ในอนาคต

Viggle ตื่นเต้นที่จะได้สำรวจศักยภาพของ Gemini 2.0 และโมเดลการสร้างรูปภาพเพิ่มเติมเพื่อปรับปรุงแพลตฟอร์มของตน และมองเห็นอนาคตที่ AI จะผสานรวมเข้ากับทุกขั้นตอนของกระบวนการสร้างสรรค์ได้อย่างราบรื่น ซึ่งจะช่วยให้ทุกคนเป็นครีเอเตอร์วิดีโอได้

"ที่ Viggle ทุกคนเป็นครีเอเตอร์ เรากำลังสร้างมีม สำรวจการจับการเคลื่อนไหวสำหรับโปรเจ็กต์ระดับถัดไป และสร้างมัลติเวิร์สของเราเอง ความสามารถในการบรรยายด้วยเสียงที่สมจริงของ Gemini 2.0 Flash จะช่วยให้ผู้ใช้ปลดล็อกศักยภาพใหม่ๆ และสร้างสรรค์การเล่าเรื่องได้อย่างที่ไม่เคยมีมาก่อน"

— Hang Chu ผู้ก่อตั้ง Viggle

การทำงานของ Viggle ร่วมกับ Gemini 2.0 Flash และ Imagen 3 แสดงให้เห็นถึงศักยภาพของ AI ในการพลิกโฉมการสร้างวิดีโอและเพิ่มศักยภาพให้ผู้ใช้มีเครื่องมือใหม่ๆ ในการแสดงออก การทำงานร่วมกันครั้งนี้ถือเป็นก้าวหนึ่งสู่อนาคตของการเล่าเรื่องที่ขับเคลื่อนด้วย AI ดูข้อมูลเพิ่มเติมเกี่ยวกับการสร้างด้วย Gemini ได้ที่เอกสารประกอบของ Gemini API และอ่านเพิ่มเติมเกี่ยวกับ Imagen 3 เพื่อดูความก้าวหน้าล่าสุดของเราในการสร้างรูปภาพ