สร้างรูปภาพโดยใช้ Imagen

Imagen เป็นโมเดลการสร้างรูปภาพที่มีความเที่ยงตรงสูงของ Google ซึ่งสามารถสร้าง รูปภาพที่สมจริงและมีคุณภาพสูงจากพรอมต์ข้อความ รูปภาพที่สร้างขึ้นทั้งหมด จะมีลายน้ำ SynthID ดูข้อมูลเพิ่มเติมเกี่ยวกับโมเดล Imagen เวอร์ชันต่างๆ ที่พร้อมใช้งานได้ที่ส่วนเวอร์ชันของโมเดล

สร้างรูปภาพโดยใช้โมเดล Imagen

ตัวอย่างนี้แสดงการสร้างรูปภาพด้วยโมเดล Imagen

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

Go

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
รูปภาพที่ AI สร้างขึ้นของหุ่นยนต์ที่ถือสเกตบอร์ดสีแดง
รูปภาพหุ่นยนต์ถือสเกตบอร์ดสีแดงที่ AI สร้างขึ้น

การกำหนดค่า Imagen

ปัจจุบัน Imagen รองรับเฉพาะพรอมต์ภาษาอังกฤษและพารามิเตอร์ต่อไปนี้

  • numberOfImages: จำนวนรูปภาพที่จะสร้าง ตั้งแต่ 1 ถึง 4 (รวม) ค่าเริ่มต้นคือ 4
  • sampleImageSize: ขนาดของรูปภาพที่สร้างขึ้น ฟีเจอร์นี้รองรับเฉพาะรุ่น Standard และ Ultra ค่าที่รองรับคือ 1K และ 2K ค่าเริ่มต้นคือ 1K
  • aspectRatio: เปลี่ยนสัดส่วนภาพของรูปภาพที่สร้างขึ้น ค่าที่รองรับคือ "1:1", "3:4", "4:3", "9:16" และ "16:9" ค่าเริ่มต้นคือ "1:1"
  • personGeneration: อนุญาตให้โมเดลสร้างรูปภาพบุคคล ค่าที่รองรับมีดังนี้

    • "dont_allow": บล็อกการสร้างรูปภาพบุคคล
    • "allow_adult": สร้างรูปภาพของผู้ใหญ่ แต่ไม่ใช่เด็ก ซึ่งเป็นค่าเริ่มต้น
    • "allow_all": สร้างรูปภาพที่มีผู้ใหญ่และเด็ก

คู่มือการใช้พรอมต์ Imagen

ส่วนนี้ของคำแนะนำเกี่ยวกับ Imagen จะแสดงให้เห็นว่าการแก้ไขพรอมต์ข้อความเป็นรูปภาพ สามารถสร้างผลลัพธ์ที่แตกต่างกันได้อย่างไร พร้อมตัวอย่างรูปภาพที่คุณสร้างได้

ข้อมูลเบื้องต้นเกี่ยวกับการเขียนพรอมต์

พรอมต์ที่ดีควรมีคำอธิบายที่ชัดเจน และใช้คีย์เวิร์ดและตัวแก้ไขที่มีความหมาย เริ่มต้นด้วยการคิดถึงหัวข้อ บริบท และสไตล์

พรอมต์ที่มีการเน้นตัวแบบ บริบท และสไตล์
ข้อความรูปภาพ: ภาพร่าง (สไตล์) ของอาคารอพาร์ตเมนต์สมัยใหม่ (เรื่อง) ที่ล้อมรอบด้วยตึกระฟ้า (บริบทและพื้นหลัง)
  1. เรื่อง: สิ่งแรกที่ต้องคิดถึงเมื่อใช้พรอมต์คือเรื่อง ซึ่งก็คือวัตถุ บุคคล สัตว์ หรือทิวทัศน์ที่คุณต้องการให้เป็นรูปภาพ

  2. บริบทและพื้นหลัง: พื้นหลังหรือบริบท ที่วางวัตถุมีความสำคัญไม่แพ้กัน ลองวางวัตถุในพื้นหลังที่หลากหลาย เช่น สตูดิโอที่มีพื้นหลังสีขาว กลางแจ้ง หรือ สภาพแวดล้อมในร่ม

  3. สไตล์: สุดท้าย ให้เพิ่มสไตล์ของรูปภาพที่ต้องการ สไตล์อาจเป็นแบบทั่วไป (ภาพวาด ภาพถ่าย ภาพร่าง) หรือเฉพาะเจาะจงมาก (ภาพวาดสีพาสเทล ภาพวาด ถ่าน ภาพ 3 มิติแบบไอโซเมตริก) นอกจากนี้ คุณยังรวมสไตล์ได้ด้วย

หลังจากเขียนพรอมต์เวอร์ชันแรกแล้ว ให้ปรับแต่งพรอมต์โดยเพิ่ม รายละเอียดเพิ่มเติมจนกว่าจะได้รูปภาพที่ต้องการ การทำซ้ำเป็นสิ่งสำคัญ เริ่มต้นด้วยการกำหนดแนวคิดหลัก จากนั้นปรับแต่งและขยายแนวคิดหลักนั้นจนกว่ารูปภาพที่สร้างขึ้นจะใกล้เคียงกับวิสัยทัศน์ของคุณ

รูปภาพตัวอย่างสมจริง 1
พรอมต์: สวนสาธารณะในฤดูใบไม้ผลิริมทะเลสาบ
รูปภาพตัวอย่างแบบสมจริง 2
พรอมต์: สวนในฤดูใบไม้ผลิริมทะเลสาบ พระอาทิตย์ตกเหนือทะเลสาบ ช่วงเวลาโกลเด้น
รูปภาพตัวอย่างแบบสมจริง 3
พรอมต์: สวนสาธารณะในฤดูใบไม้ผลิริมทะเลสาบ พระอาทิตย์ตกข้ามทะเลสาบ ช่วงเวลาโกลเด้นอาร์ว ดอกไม้ป่าสีแดง

โมเดล Imagen สามารถเปลี่ยนไอเดียของคุณให้กลายเป็นรูปภาพที่มีรายละเอียด ไม่ว่าพรอมต์ของคุณจะสั้นหรือยาวและมีรายละเอียดก็ตาม ปรับแต่งวิสัยทัศน์ของคุณ ผ่านการป้อนพรอมต์แบบวนซ้ำ โดยเพิ่มรายละเอียดจนกว่าจะได้ผลลัพธ์ที่สมบูรณ์แบบ

พรอมต์แบบสั้นช่วยให้คุณสร้างรูปภาพได้อย่างรวดเร็ว

ตัวอย่างพรอมต์สั้นๆ สำหรับ Imagen 3
พรอมต์: ภาพถ่ายระยะใกล้ของผู้หญิงในช่วงอายุ 20 ปี, ภาพถ่ายแนวสตรีท ภาพจากภาพยนตร์, โทนสีส้มอบอุ่น

พรอมต์ที่ยาวขึ้นจะช่วยให้คุณเพิ่มรายละเอียดที่เฉพาะเจาะจงและสร้างรูปภาพได้

ตัวอย่างพรอมต์ยาวของ Imagen 3
พรอมต์: ภาพถ่ายที่น่าดึงดูดใจของผู้หญิงในช่วงอายุ 20 ปีที่ใช้สไตล์ การถ่ายภาพบนท้องถนน รูปภาพควรมีลักษณะเหมือนภาพยนตร์ที่มีโทนสีส้ม อบอุ่น

คำแนะนำเพิ่มเติมสำหรับการเขียนพรอมต์ของ Imagen

  • ใช้ภาษาที่สื่อความหมาย: ใช้คำคุณศัพท์และคำกริยาวิเศษณ์โดยละเอียดเพื่อ วาดภาพที่ชัดเจนสำหรับ Imagen
  • ระบุบริบท: หากจำเป็น ให้ใส่ข้อมูลเบื้องหลังเพื่อช่วยให้ AI เข้าใจ
  • อ้างอิงศิลปินหรือสไตล์ที่เฉพาะเจาะจง: หากคุณมีสุนทรียะที่เฉพาะเจาะจงในใจ การอ้างอิงศิลปินหรือขบวนการศิลปะที่เฉพาะเจาะจงอาจเป็นประโยชน์
  • ใช้เครื่องมือวิศวกรรมพรอมต์: ลองสำรวจเครื่องมือหรือแหล่งข้อมูลวิศวกรรมพรอมต์ เพื่อช่วยปรับแต่งพรอมต์และให้ได้ผลลัพธ์ที่ดีที่สุด
  • ปรับปรุงรายละเอียดใบหน้าในรูปภาพส่วนตัวและรูปภาพกลุ่ม: ระบุรายละเอียดใบหน้าเป็นจุดโฟกัสของรูปภาพ (เช่น ใช้คำว่า "ภาพบุคคล" ในพรอมต์)

สร้างข้อความในรูปภาพ

โมเดล Imagen สามารถเพิ่มข้อความลงในรูปภาพได้ ซึ่งจะช่วยเปิดโอกาสในการสร้างรูปภาพที่สร้างสรรค์มากขึ้น คำแนะนำต่อไปนี้จะช่วยให้คุณใช้ประโยชน์จากฟีเจอร์นี้ได้มากที่สุด

  • ทำซ้ำได้อย่างมั่นใจ: คุณอาจต้องสร้างรูปภาพใหม่จนกว่าจะได้ รูปลักษณ์ที่ต้องการ การผสานรวมข้อความของ Imagen ยังคง พัฒนาต่อไป และบางครั้งการลองหลายๆ ครั้งอาจให้ผลลัพธ์ที่ดีที่สุด
  • ใช้ข้อความสั้นๆ: จำกัดข้อความให้มีอักขระไม่เกิน 25 ตัวเพื่อการสร้างที่เหมาะสมที่สุด
  • วลีหลายวลี: ทดลองใช้วลีที่แตกต่างกัน 2-3 วลีเพื่อ ให้ข้อมูลเพิ่มเติม หลีกเลี่ยงการใช้คำมากกว่า 3 คำเพื่อให้ องค์ประกอบมีความชัดเจนยิ่งขึ้น

    ตัวอย่างข้อความที่ Imagen 3 สร้างขึ้น
    พรอมต์: โปสเตอร์ที่มีข้อความ "Summerland" ในแบบอักษรตัวหนาเป็น ชื่อ ใต้ข้อความนี้คือสโลแกน "Summer never felt so good"
  • คำแนะนำในการจัดวาง: แม้ว่า Imagen จะพยายามจัดวางข้อความ ตามที่สั่ง แต่ก็อาจมีการเปลี่ยนแปลงเป็นครั้งคราว ฟีเจอร์นี้ได้รับการปรับปรุงอย่างต่อเนื่อง

  • รูปแบบตัวอักษรที่สร้างแรงบันดาลใจ: ระบุรูปแบบตัวอักษรทั่วไปเพื่อมีอิทธิพลต่อตัวเลือกของ Imagen อย่างละเอียด อย่าคาดหวังว่าจะมีการจำลองแบบอักษรที่แม่นยำ แต่ให้คาดหวังถึงการตีความอย่างสร้างสรรค์

  • ขนาดแบบอักษร: ระบุขนาดแบบอักษรหรือข้อบ่งชี้ทั่วไปเกี่ยวกับขนาด (เช่น เล็ก กลาง ใหญ่) เพื่อกำหนดการสร้างขนาดแบบอักษร

การกำหนดพารามิเตอร์ของพรอมต์

คุณอาจต้องกำหนดพารามิเตอร์อินพุตใน Imagen เพื่อควบคุมผลลัพธ์ได้ดียิ่งขึ้น ตัวอย่างเช่น สมมติว่าคุณต้องการให้ลูกค้าสร้างโลโก้สำหรับธุรกิจของตนเองได้ และต้องการให้มั่นใจว่าระบบจะสร้างโลโก้บนพื้นหลังสีทึบเสมอ นอกจากนี้ คุณยังอาจต้องการจำกัดตัวเลือกที่ไคลเอ็นต์เลือกได้จากเมนูด้วย

ในตัวอย่างนี้ คุณสามารถสร้างพรอมต์ที่มีพารามิเตอร์คล้ายกับพรอมต์ต่อไปนี้ได้

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

ในอินเทอร์เฟซผู้ใช้ที่กำหนดเอง ลูกค้าจะป้อนพารามิเตอร์ได้โดยใช้ เมนู และค่าที่เลือกจะป้อนลงในพรอมต์ที่ Imagen ได้รับ

เช่น

  1. พรอมต์: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    ตัวอย่างการกำหนดพารามิเตอร์พรอมต์ของ Imagen 3 1

  2. พรอมต์: A modern logo for a software company on a solid color background. Include the text Silo.

    ตัวอย่างการกำหนดพารามิเตอร์พรอมต์ของ Imagen 3 2

  3. พรอมต์: A traditional logo for a baking company on a solid color background. Include the text Seed.

    ตัวอย่างการกำหนดพารามิเตอร์พรอมต์ของ Imagen 3

เทคนิคการเขียนพรอมต์ขั้นสูง

ใช้ตัวอย่างต่อไปนี้เพื่อสร้างพรอมต์ที่เฉพาะเจาะจงมากขึ้นโดยอิงตามแอตทริบิวต์ เช่น คำอธิบายการถ่ายภาพ รูปร่างและวัสดุ ขบวนการศิลปะในประวัติศาสตร์ และตัวแก้ไขคุณภาพรูปภาพ

การถ่ายภาพ

  • พรอมต์มีข้อความว่า "รูปภาพของ..."

หากต้องการใช้สไตล์นี้ ให้เริ่มต้นด้วยการใช้คีย์เวิร์ดที่บอก Imagen อย่างชัดเจนว่าคุณกำลังมองหารูปภาพ เริ่มต้นพรอมต์ด้วย "รูปภาพของ . " เช่น

รูปภาพตัวอย่างสมจริง 1
พรอมต์: รูปภาพเมล็ดกาแฟในครัวบนพื้นผิวไม้
รูปภาพตัวอย่างแบบสมจริง 2
พรอมต์: รูปภาพแท่งช็อกโกแลตบนเคาน์เตอร์ครัว
รูปภาพตัวอย่างแบบสมจริง 3
พรอมต์: รูปภาพของอาคารสมัยใหม่ที่มีน้ำอยู่เบื้องหลัง

แหล่งที่มาของรูปภาพ: รูปภาพแต่ละรูปสร้างขึ้นโดยใช้พรอมต์ข้อความที่เกี่ยวข้องกับโมเดล Imagen 3

ตัวปรับแต่งการถ่ายภาพ

ในตัวอย่างต่อไปนี้ คุณจะเห็นตัวแก้ไขและพารามิเตอร์เฉพาะการถ่ายภาพหลายรายการ คุณรวมตัวแก้ไขหลายรายการเพื่อควบคุมได้แม่นยำยิ่งขึ้น

  1. ระยะใกล้ของกล้อง - ถ่ายจากระยะใกล้ ถ่ายจากระยะไกล

    ภาพตัวอย่างกล้องระยะใกล้
    พรอมต์: รูปภาพระยะใกล้ของเมล็ดกาแฟ
    ภาพตัวอย่างกล้องที่ซูมออก
    พรอมต์: ภาพซูมออกของถุงเล็กๆ ที่ใส่
    เมล็ดกาแฟในครัวที่รก

  2. ตำแหน่งกล้อง - มุมสูง จากด้านล่าง

    ภาพตัวอย่างภาพถ่ายทางอากาศ
    พรอมต์: ภาพถ่ายทางอากาศของเมืองที่มีตึกสูง
    ภาพตัวอย่างมุมมองจากด้านล่าง
    พรอมต์: ภาพหลังคาป่าที่มีท้องฟ้าสีฟ้าจากด้านล่าง
  3. แสง - ธรรมชาติ ดราม่า อบอุ่น เย็น

    รูปภาพตัวอย่างแสงธรรมชาติ
    พรอมต์: ภาพถ่ายสตูดิโอของอาร์มแชร์สมัยใหม่ แสงธรรมชาติ
    รูปภาพตัวอย่างแสงที่น่าทึ่ง
    พรอมต์: ภาพถ่ายสตูดิโอของอาร์มแชร์สมัยใหม่ การปรับแสงที่น่าทึ่ง
  4. การตั้งค่ากล้อง - ภาพเบลอจากการเคลื่อนไหว โฟกัสแบบนุ่ม โบเก้ ภาพบุคคล

    รูปภาพตัวอย่างการเบลอจากการเคลื่อนไหว
    พรอมต์: รูปภาพเมืองที่มีตึกระฟ้าจากภายในรถยนต์ที่มีภาพเบลอจากการเคลื่อนไหว
    รูปภาพตัวอย่างซอฟต์โฟกัส
    พรอมต์: ซอฟต์โฟกัสภาพถ่ายสะพานในเมืองยามค่ำคืน
  5. ประเภทเลนส์ - 35 มม., 50 มม., ฟิชอาย, มุมกว้าง, มาโคร

    รูปภาพตัวอย่างจากเลนส์มาโคร
    พรอมต์: ภาพใบไม้ เลนส์มาโคร
    รูปภาพตัวอย่างเลนส์ฟิชอาย
    พรอมต์: ภาพถ่ายบนท้องถนน, นิวยอร์กซิตี้, เลนส์ฟิชอาย
  6. ประเภทฟิล์ม - ขาวดำ โพลารอยด์

    รูปภาพตัวอย่างภาพถ่ายโพลารอยด์
    พรอมต์: ภาพถ่ายบุคคลแบบโพลารอยด์ของสุนัขที่สวมแว่นกันแดด
    รูปภาพตัวอย่างภาพถ่ายขาวดำ
    พรอมต์: ภาพถ่ายขาวดำของสุนัขที่สวมแว่นกันแดด

แหล่งที่มาของรูปภาพ: รูปภาพแต่ละรูปสร้างขึ้นโดยใช้พรอมต์ข้อความที่เกี่ยวข้องกับโมเดล Imagen 3

ภาพวาดและศิลปะ

  • พรอมต์มีข้อความว่า "painting ของ..." "sketch ของ..."

สไตล์ศิลปะมีตั้งแต่สไตล์ขาวดำ เช่น ภาพร่างดินสอ ไปจนถึงศิลปะดิจิทัลที่มีความสมจริงสูง ตัวอย่างเช่น รูปภาพต่อไปนี้ใช้พรอมต์เดียวกันแต่มีสไตล์แตกต่างกัน

"[art style or creation technique]ของรถซีดานไฟฟ้าสปอร์ตแบบเหลี่ยมที่มีตึกระฟ้าเป็นฉากหลัง"

รูปภาพตัวอย่างงานศิลปะ
พรอมต์: ภาพวาดดินสอเทคนิคของ...
รูปภาพตัวอย่างงานศิลปะ
พรอมต์: ภาพวาดด้วยถ่านของ...
รูปภาพตัวอย่างงานศิลปะ
พรอมต์: ภาพวาดด้วยดินสอสีของ...
รูปภาพตัวอย่างงานศิลปะ
พรอมต์: ภาพวาดสีพาสเทลของ...
รูปภาพตัวอย่างงานศิลปะ
พรอมต์: อาร์ตดิจิทัลของ...
รูปภาพตัวอย่างงานศิลปะ
พรอมต์: อาร์ตเดโค (โปสเตอร์) ของ...

แหล่งที่มาของรูปภาพ: รูปภาพแต่ละรูปสร้างขึ้นโดยใช้พรอมต์ข้อความที่เกี่ยวข้องกับโมเดล Imagen 2

รูปร่างและวัสดุ
  • พรอมต์มีข้อความต่อไปนี้ "...ทำจาก..." "...ในรูปของ..."

จุดแข็งอย่างหนึ่งของเทคโนโลยีนี้คือคุณสามารถสร้างภาพที่ ทำได้ยากหรือทำไม่ได้เลย เช่น คุณสามารถสร้างโลโก้บริษัทขึ้นใหม่ในวัสดุและพื้นผิวต่างๆ

ภาพตัวอย่างรูปร่างและวัสดุ 1
พรอมต์: กระเป๋าทรงยาวฐานกลมทำจากชีส
ภาพตัวอย่างรูปร่างและวัสดุ 2
พรอมต์: หลอดไฟนีออนในรูปทรงของนก
รูปภาพตัวอย่างรูปร่างและวัสดุ 3
พรอมต์: เก้าอี้เท้าแขนทำจากกระดาษ ภาพถ่ายในสตูดิโอ สไตล์โอริกามิ

แหล่งที่มาของรูปภาพ: รูปภาพแต่ละรูปสร้างขึ้นโดยใช้พรอมต์ข้อความที่เกี่ยวข้องกับโมเดล Imagen 3

ข้อมูลอ้างอิงเกี่ยวกับศิลปะในอดีต

  • พรอมต์มีข้อความว่า "...ในสไตล์ของ..."

สไตล์บางอย่างกลายเป็นสัญลักษณ์ที่โดดเด่นในช่วงหลายปีที่ผ่านมา ต่อไปนี้เป็นไอเดีย ภาพวาดหรือสไตล์ศิลปะในประวัติศาสตร์ที่คุณลองใช้ได้

"สร้างรูปภาพในสไตล์ของ [art period or movement] : ฟาร์มกังหันลม"

รูปภาพตัวอย่างลัทธิประทับใจ
พรอมต์: สร้างรูปภาพในสไตล์ภาพวาดแนวอิมเพรสชันนิสต์: ฟาร์มกังหันลม
ตัวอย่างรูปภาพยุคฟื้นฟูศิลปวิทยา
พรอมต์: สร้างรูปภาพในสไตล์ภาพวาดเรเนซองส์: ฟาร์มกังหันลม
ภาพตัวอย่างป๊อปอาร์ต
พรอมต์: สร้างรูปภาพในสไตล์ป๊อปอาร์ต: กังหันลม

แหล่งที่มาของรูปภาพ: รูปภาพแต่ละรูปสร้างขึ้นโดยใช้พรอมต์ข้อความที่เกี่ยวข้องกับโมเดล Imagen 3

ตัวแก้ไขคุณภาพรูปภาพ

คีย์เวิร์ดบางคำจะช่วยให้โมเดลทราบว่าคุณกำลังมองหาชิ้นงานคุณภาพสูง ตัวอย่างตัวแก้ไขคุณภาพมีดังนี้

  • ตัวดัดแปลงทั่วไป - คุณภาพสูง สวยงาม มีสไตล์
  • รูปภาพ - 4K, HDR, รูปภาพสตูดิโอ
  • อาร์ตเวิร์ก ภาพวาด - โดยมืออาชีพ มีรายละเอียด

ต่อไปนี้คือตัวอย่างพรอมต์บางส่วนที่ไม่มีตัวปรับแต่งคุณภาพและพรอมต์เดียวกันที่มีตัวปรับแต่งคุณภาพ

รูปภาพตัวอย่างข้าวโพดที่ไม่มีตัวแก้ไข
พรอมต์ (ไม่มีตัวปรับแต่งคุณภาพ): รูปภาพต้นข้าวโพด
รูปภาพตัวอย่างข้าวโพดพร้อมตัวแก้ไข
พรอมต์ (พร้อมตัวปรับคุณภาพ): 4k HDR สวยงาม
รูปภาพต้นข้าวโพดถ่ายโดย
ช่างภาพมืออาชีพ

แหล่งที่มาของรูปภาพ: รูปภาพแต่ละรูปสร้างขึ้นโดยใช้พรอมต์ข้อความที่เกี่ยวข้องกับโมเดล Imagen 3

สัดส่วนภาพ

การสร้างรูปภาพด้วย Imagen ช่วยให้คุณตั้งค่าสัดส่วนภาพที่แตกต่างกันได้ 5 แบบ

  1. สี่เหลี่ยมจัตุรัส (1:1, ค่าเริ่มต้น) - รูปภาพสี่เหลี่ยมจัตุรัสมาตรฐาน การใช้งานทั่วไปสำหรับ สัดส่วนภาพนี้ ได้แก่ โพสต์ในโซเชียลมีเดีย
  2. เต็มหน้าจอ (4:3) - สัดส่วนภาพนี้มักใช้ในสื่อหรือภาพยนตร์ นอกจากนี้ยังเป็นขนาดของทีวีรุ่นเก่า (ไม่ใช่จอกว้าง) ส่วนใหญ่และกล้องฟอร์แมตขนาดกลาง โดยจะจับภาพฉากในแนวนอนได้มากกว่า (เมื่อเทียบกับ 1:1) จึงเป็นสัดส่วนภาพที่นิยมใช้ในการถ่ายภาพ

    ตัวอย่างสัดส่วนภาพ
    พรอมต์: ภาพนิ้วมือของนักดนตรีในระยะใกล้ กำลังเล่นเปียโน ฟิล์มขาวดำ วินเทจ (สัดส่วนภาพ 4:3)
    ตัวอย่างสัดส่วนภาพ
    พรอมต์: ภาพถ่ายในสตูดิโอระดับมืออาชีพของ เฟรนช์ฟรายสำหรับร้านอาหารระดับไฮเอนด์ ในสไตล์นิตยสารอาหาร (สัดส่วนภาพ 4:3)
  3. เต็มหน้าจอแนวตั้ง (3:4) - นี่คือสัดส่วนภาพแบบเต็มหน้าจอที่หมุน 90 องศา ซึ่งช่วยให้จับภาพฉากในแนวตั้งได้มากขึ้นเมื่อเทียบกับสัดส่วนภาพ 1:1

    ตัวอย่างสัดส่วนภาพ
    พรอมต์: ผู้หญิงเดินป่า ภาพระยะใกล้ของ รองเท้าบูทที่สะท้อนในแอ่งน้ำ ภูเขาขนาดใหญ่เป็นฉากหลัง ใน สไตล์โฆษณา มุมที่น่าทึ่ง (สัดส่วนภาพ 3:4)
    ตัวอย่างสัดส่วนภาพ
    พรอมต์: ภาพมุมสูงของแม่น้ำที่ไหล ขึ้นไปในหุบเขาลึกลับ (สัดส่วนภาพ 3:4)
  4. จอกว้าง (16:9) - อัตราส่วนนี้มาแทนที่ 4:3 และปัจจุบันเป็นอัตราส่วนที่พบมากที่สุด สำหรับทีวี จอภาพ และหน้าจอโทรศัพท์มือถือ (แนวนอน) ใช้สัดส่วนภาพนี้เมื่อต้องการบันทึกภาพพื้นหลังให้มากขึ้น (เช่น ทิวทัศน์ที่สวยงาม)

    ตัวอย่างสัดส่วนภาพ
    พรอมต์: ชายสวมเสื้อผ้าสีขาวทั้งหมดนั่งอยู่บนชายหาด ถ่ายภาพระยะใกล้ แสงช่วงโกลเด้นอาร์ว (สัดส่วนภาพ 16:9 )
  5. แนวตั้ง (9:16) - อัตราส่วนนี้เป็นจอกว้างแต่หมุน อัตราส่วนภาพนี้เป็นอัตราส่วนภาพที่ค่อนข้างใหม่ซึ่งได้รับความนิยมจากแอปวิดีโอแบบสั้น (เช่น YouTube Shorts) ใช้สำหรับวัตถุสูงที่มี การวางแนวตั้งที่ชัดเจน เช่น อาคาร ต้นไม้ น้ำตก หรือวัตถุอื่นๆ ที่คล้ายกัน

    ตัวอย่างสัดส่วนภาพ
    พรอมต์: ภาพเรนเดอร์ดิจิทัลของตึกระฟ้าขนาดใหญ่ ทันสมัย ยิ่งใหญ่ อลังการ โดยมีภาพพระอาทิตย์ตกที่สวยงามเป็นพื้นหลัง (สัดส่วนภาพ 9:16)

รูปภาพสมจริง

โมเดลการสร้างรูปภาพ เวอร์ชันต่างๆ อาจให้ผลลัพธ์ทั้งแบบศิลปะและแบบสมจริง ใช้คำต่อไปนี้ในพรอมต์เพื่อสร้างเอาต์พุตที่สมจริงยิ่งขึ้นตามวัตถุที่คุณต้องการสร้าง

กรณีการใช้งาน ประเภทเลนส์ ความยาวโฟกัส รายละเอียดเพิ่มเติม
ผู้คน (ภาพบุคคล) ไพรม์ ซูม 24-35 มม. ฟิล์มขาวดำ, ฟิล์มนัวร์, ระยะชัดลึก, ดูโอโทน (ระบุ 2 สี)
อาหาร แมลง พืช (วัตถุ ภาพหุ่นนิ่ง) มาโคร 60-105 มม. รายละเอียดสูง โฟกัสแม่นยำ แสงที่ควบคุมได้
กีฬา สัตว์ป่า (การเคลื่อนไหว) ซูมเทเลโฟโต้ 100-400 มม. ความเร็วชัตเตอร์สูง การติดตามการเคลื่อนไหวหรือการเคลื่อนที่
ดาราศาสตร์, ภูมิทัศน์ (มุมกว้าง) ไวด์ 10-24 มม. เวลาเปิดรับแสงนาน โฟกัสคมชัด เปิดรับแสงนาน น้ำหรือเมฆที่นุ่มนวล
ภาพพอร์เทรต
กรณีการใช้งาน ประเภทเลนส์ ความยาวโฟกัส รายละเอียดเพิ่มเติม
ผู้คน (ภาพบุคคล) ไพรม์ ซูม 24-35 มม. ฟิล์มขาวดำ, ฟิล์มนัวร์, ระยะชัดลึก, ดูโอโทน (ระบุ 2 สี)

Imagen สามารถสร้างภาพบุคคลต่อไปนี้ได้โดยใช้คีย์เวิร์ดหลายคำจากตาราง

ตัวอย่างการถ่ายภาพบุคคล ตัวอย่างการถ่ายภาพบุคคล ตัวอย่างการถ่ายภาพบุคคล ตัวอย่างการถ่ายภาพบุคคล

พรอมต์: ภาพบุคคล 35 มม. ของผู้หญิงที่มีภาพดูโอโทนสีน้ำเงินและเทา
โมเดล: imagen-3.0-generate-002

ตัวอย่างการถ่ายภาพบุคคล ตัวอย่างการถ่ายภาพบุคคล ตัวอย่างการถ่ายภาพบุคคล ตัวอย่างการถ่ายภาพบุคคล

พรอมต์: ภาพบุคคลผู้หญิงขนาด 35 มม. สไตล์ฟิล์มนัวร์
โมเดล: imagen-3.0-generate-002

วัตถุ
กรณีการใช้งาน ประเภทเลนส์ ความยาวโฟกัส รายละเอียดเพิ่มเติม
อาหาร แมลง พืช (วัตถุ ภาพหุ่นนิ่ง) มาโคร 60-105 มม. รายละเอียดสูง โฟกัสแม่นยำ แสงที่ควบคุมได้

Imagen สามารถสร้างรูปภาพออบเจ็กต์ต่อไปนี้ได้โดยใช้คีย์เวิร์ดหลายคำจากตาราง

ตัวอย่างการถ่ายภาพวัตถุ ตัวอย่างการถ่ายภาพวัตถุ ตัวอย่างการถ่ายภาพวัตถุ ตัวอย่างการถ่ายภาพวัตถุ

พรอมต์: ใบของต้นว่านเศรษฐีเรือนนอก เลนส์มาโคร 60 มม.
โมเดล: imagen-3.0-generate-002

ตัวอย่างการถ่ายภาพวัตถุ ตัวอย่างการถ่ายภาพวัตถุ ตัวอย่างการถ่ายภาพวัตถุ ตัวอย่างการถ่ายภาพวัตถุ

พรอมต์: จานพาสต้า เลนส์มาโคร 100 มม.
โมเดล: imagen-3.0-generate-002

การเคลื่อนไหว
กรณีการใช้งาน ประเภทเลนส์ ความยาวโฟกัส รายละเอียดเพิ่มเติม
กีฬา สัตว์ป่า (การเคลื่อนไหว) ซูมเทเลโฟโต้ 100-400 มม. ความเร็วชัตเตอร์สูง การติดตามการเคลื่อนไหวหรือการเคลื่อนที่

เมื่อใช้คีย์เวิร์ดหลายคำจากตาราง Imagen จะ สร้างภาพเคลื่อนไหวต่อไปนี้ได้

ตัวอย่างการถ่ายภาพเคลื่อนไหว ตัวอย่างการถ่ายภาพเคลื่อนไหว ตัวอย่างการถ่ายภาพเคลื่อนไหว ตัวอย่างการถ่ายภาพเคลื่อนไหว

พรอมต์: ทัชดาวน์ที่ชนะ ความเร็วชัตเตอร์สูง การติดตามการเคลื่อนไหว
โมเดล: imagen-3.0-generate-002

ตัวอย่างการถ่ายภาพเคลื่อนไหว ตัวอย่างการถ่ายภาพเคลื่อนไหว ตัวอย่างการถ่ายภาพเคลื่อนไหว ตัวอย่างการถ่ายภาพเคลื่อนไหว

พรอมต์: กวางวิ่งในป่า ความเร็วชัตเตอร์สูง การติดตามการเคลื่อนไหว
โมเดล: imagen-3.0-generate-002

ไวด์
กรณีการใช้งาน ประเภทเลนส์ ความยาวโฟกัส รายละเอียดเพิ่มเติม
ดาราศาสตร์, ภูมิทัศน์ (มุมกว้าง) ไวด์ 10-24 มม. เวลาเปิดรับแสงนาน โฟกัสคมชัด เปิดรับแสงนาน น้ำหรือเมฆที่นุ่มนวล

Imagen สามารถสร้างรูปภาพมุมกว้างต่อไปนี้ได้โดยใช้คีย์เวิร์ดหลายคำจากตาราง

ตัวอย่างการถ่ายภาพมุมกว้าง ตัวอย่างการถ่ายภาพมุมกว้าง ตัวอย่างการถ่ายภาพมุมกว้าง ตัวอย่างการถ่ายภาพมุมกว้าง

พรอมต์: เทือกเขากว้างใหญ่ มุมกว้างแนวนอน 10 มม.
โมเดล: imagen-3.0-generate-002

ตัวอย่างการถ่ายภาพมุมกว้าง ตัวอย่างการถ่ายภาพมุมกว้าง ตัวอย่างการถ่ายภาพมุมกว้าง ตัวอย่างการถ่ายภาพมุมกว้าง

พรอมต์: รูปภาพดวงจันทร์ การถ่ายภาพดวงดาว มุมกว้าง 10 มม.
โมเดล: imagen-3.0-generate-002

เวอร์ชันของโมเดล

Imagen 4

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

imagen-4.0-generate-001
imagen-4.0-ultra-generate-001
imagen-4.0-fast-generate-001

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

รูปภาพ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

480 โทเค็น (ข้อความ)

รูปภาพเอาต์พุต

1 ถึง 4 (Ultra/Standard/Fast)

การอัปเดตล่าสุด มิถุนายน 2025

Imagen 3

พร็อพเพอร์ตี้ คำอธิบาย
รหัสโมเดล

Gemini API

imagen-3.0-generate-002

ประเภทข้อมูลที่รองรับ

อินพุต

ข้อความ

เอาต์พุต

รูปภาพ

ขีดจำกัดของโทเค็น[*]

ขีดจำกัดโทเค็นอินพุต

ไม่มี

รูปภาพเอาต์พุต

สูงสุด 4 รายการ

การอัปเดตล่าสุด กุมภาพันธ์ 2025