Tạo hình ảnh bằng Imagen

Imagen là mô hình tạo hình ảnh có độ trung thực cao của Google, có khả năng tạo ra hình ảnh chân thực và chất lượng cao từ câu lệnh bằng văn bản. Tất cả hình ảnh được tạo đều có hình mờ SynthID. Để tìm hiểu thêm về các biến thể mô hình Imagen hiện có, hãy xem phần Các phiên bản mô hình.

Tạo hình ảnh bằng các mô hình Imagen

Ví dụ này minh hoạ cách tạo hình ảnh bằng mô hình Imagen:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

Go

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Hình ảnh do AI tạo về một rô-bốt đang cầm ván trượt màu đỏ
Hình ảnh do AI tạo về một robot đang cầm ván trượt màu đỏ

Cấu hình Imagen

Hiện tại, Imagen chỉ hỗ trợ câu lệnh bằng tiếng Anh và các thông số sau:

  • numberOfImages: Số lượng hình ảnh cần tạo, từ 1 đến 4 (bao gồm cả 1 và 4). Giá trị mặc định là 4.
  • sampleImageSize: Kích thước của hình ảnh được tạo. Tính năng này chỉ được hỗ trợ cho các mô hình Chuẩn và Siêu. Giá trị được hỗ trợ là 1K2K. Giá trị mặc định là 1K.
  • aspectRatio: Thay đổi tỷ lệ khung hình của hình ảnh được tạo. Các giá trị được hỗ trợ là "1:1", "3:4", "4:3", "9:16""16:9". Giá trị mặc định là "1:1".
  • personGeneration: Cho phép mô hình tạo hình ảnh về con người. Sau đây là các giá trị được hỗ trợ:

    • "dont_allow": Chặn việc tạo hình ảnh có người.
    • "allow_adult": Tạo hình ảnh về người lớn, nhưng không tạo hình ảnh về trẻ em. Đây là tuỳ chọn mặc định
    • "allow_all": Tạo hình ảnh có cả người lớn và trẻ em.

Hướng dẫn về câu lệnh cho Imagen

Phần này trong hướng dẫn về Imagen cho bạn biết cách sửa đổi câu lệnh từ văn bản sang hình ảnh có thể tạo ra nhiều kết quả, cùng với ví dụ về những hình ảnh bạn có thể tạo.

Kiến thức cơ bản về cách viết câu lệnh

Câu lệnh hiệu quả là câu lệnh có tính mô tả và rõ ràng, đồng thời sử dụng các từ khoá và bộ sửa đổi có ý nghĩa. Hãy bắt đầu bằng cách nghĩ đến chủ thể, bối cảnhphong cách.

Câu lệnh có chủ đề, bối cảnh và phong cách được nhấn mạnh
Văn bản trong hình ảnh: Một bản phác thảo (style) về một toà nhà chung cư hiện đại (subject) được bao quanh bởi các toà nhà chọc trời (context and background).
  1. Chủ thể: Điều đầu tiên bạn cần nghĩ đến khi đưa ra câu lệnh là chủ thể: đối tượng, người, động vật hoặc cảnh vật mà bạn muốn tạo hình ảnh.

  2. Bối cảnh và thông tin cơ bản: Bối cảnh hoặc thông tin cơ bản cũng quan trọng không kém khi đặt đối tượng. Hãy thử đặt chủ thể của bạn vào nhiều phông nền. Ví dụ: phòng chụp hình có phông nền trắng, môi trường ngoài trời hoặc trong nhà.

  3. Kiểu: Cuối cùng, hãy thêm kiểu hình ảnh mà bạn muốn. Phong cách có thể là phong cách chung (tranh vẽ, ảnh chụp, bản phác thảo) hoặc phong cách rất cụ thể (tranh vẽ bằng phấn màu, bản vẽ bằng than, hình ảnh 3D đẳng cự). Bạn cũng có thể kết hợp các kiểu.

Sau khi viết phiên bản đầu tiên của câu lệnh, hãy tinh chỉnh câu lệnh bằng cách thêm nhiều chi tiết hơn cho đến khi bạn nhận được hình ảnh mà mình muốn. Việc lặp lại là rất quan trọng. Bắt đầu bằng cách xác định ý tưởng cốt lõi, sau đó tinh chỉnh và mở rộng ý tưởng đó cho đến khi hình ảnh được tạo gần với ý tưởng của bạn.

photorealistic sample image 1
Câu lệnh: Một công viên vào mùa xuân bên cạnh một hồ nước
photorealistic sample image 2
Câu lệnh: Một công viên vào mùa xuân bên cạnh một hồ nước, mặt trời lặn trên hồ, giờ vàng
hình ảnh mẫu giống thật 3
Câu lệnh: Một công viên vào mùa xuân bên cạnh một hồ nước, mặt trời lặn trên hồ, giờ vàng, hoa dại màu đỏ

Các mô hình Imagen có thể biến ý tưởng của bạn thành hình ảnh chi tiết, cho dù câu lệnh của bạn ngắn hay dài và chi tiết. Tinh chỉnh ý tưởng của bạn thông qua việc đưa ra câu lệnh lặp đi lặp lại, thêm thông tin chi tiết cho đến khi bạn đạt được kết quả hoàn hảo.

Câu lệnh ngắn giúp bạn tạo hình ảnh một cách nhanh chóng.

Ví dụ về câu lệnh ngắn cho Imagen 3
Câu lệnh: ảnh cận cảnh một phụ nữ ở độ tuổi 20, ảnh đường phố, ảnh tĩnh trong phim, tông màu cam ấm dịu

Câu lệnh dài hơn cho phép bạn thêm thông tin chi tiết cụ thể và tạo hình ảnh.

Ví dụ về câu lệnh dài cho Imagen 3
Câu lệnh: bức ảnh quyến rũ về một người phụ nữ ở độ tuổi 20 sử dụng phong cách chụp ảnh đường phố. Hình ảnh phải trông giống như một cảnh trong phim với tông màu cam nhạt ấm áp.

Lời khuyên bổ sung về cách viết câu lệnh cho Imagen:

  • Sử dụng ngôn từ mô tả: Sử dụng các tính từ và trạng từ chi tiết để mô tả rõ ràng cho Imagen.
  • Cung cấp bối cảnh: Nếu cần, hãy thêm thông tin cơ bản để hỗ trợ AI hiểu rõ hơn.
  • Tham khảo các nghệ sĩ hoặc phong cách cụ thể: Nếu bạn có một phong cách thẩm mỹ cụ thể, thì việc tham khảo các nghệ sĩ hoặc trào lưu nghệ thuật cụ thể có thể hữu ích.
  • Sử dụng các công cụ kỹ thuật thiết kế câu lệnh: Cân nhắc việc khám phá các công cụ hoặc tài nguyên kỹ thuật thiết kế câu lệnh để giúp bạn tinh chỉnh câu lệnh và đạt được kết quả tối ưu.
  • Cải thiện chi tiết khuôn mặt trong ảnh cá nhân và ảnh nhóm: Chỉ định chi tiết khuôn mặt làm tiêu điểm của bức ảnh (ví dụ: sử dụng từ "chân dung" trong câu lệnh).

Tạo văn bản trong hình ảnh

Các mô hình Imagen có thể thêm văn bản vào hình ảnh, mở ra nhiều khả năng sáng tạo hơn trong việc tạo hình ảnh. Hãy tham khảo hướng dẫn sau để khai thác tối đa tính năng này:

  • Lặp lại một cách tự tin: Bạn có thể phải tạo lại hình ảnh cho đến khi đạt được giao diện mà bạn muốn. Tính năng tích hợp văn bản của Imagen vẫn đang phát triển và đôi khi bạn cần thử nhiều lần để có kết quả tốt nhất.
  • Sử dụng văn bản ngắn gọn: Giới hạn văn bản ở mức 25 ký tự trở xuống để tạo hình ảnh tối ưu.
  • Nhiều cụm từ: Thử nghiệm với hai hoặc ba cụm từ riêng biệt để cung cấp thêm thông tin. Tránh dùng quá 3 cụm từ để có bố cục rõ ràng hơn.

    Ví dụ về văn bản được tạo bằng Imagen 3
    Câu lệnh: Một áp phích có văn bản "Summerland" bằng phông chữ in đậm làm tiêu đề, bên dưới văn bản này là khẩu hiệu "Mùa hè chưa bao giờ tuyệt vời đến thế"
  • Vị trí của hướng dẫn: Mặc dù Imagen có thể cố gắng đặt văn bản theo chỉ dẫn, nhưng đôi khi sẽ có sự khác biệt. Tính năng này liên tục được cải thiện.

  • Kiểu phông chữ truyền cảm hứng: Chỉ định một kiểu phông chữ chung để ảnh hưởng một cách tinh tế đến các lựa chọn của Imagen. Đừng dựa vào việc sao chép phông chữ một cách chính xác, mà hãy mong đợi những cách diễn giải sáng tạo.

  • Cỡ chữ: Chỉ định cỡ chữ hoặc thông tin chung về cỡ chữ (ví dụ: nhỏ, vừa, lớn) để ảnh hưởng đến quá trình tạo cỡ chữ.

Tham số hoá câu lệnh

Để kiểm soát kết quả đầu ra tốt hơn, bạn có thể thấy việc tham số hoá đầu vào thành Imagen là hữu ích. Ví dụ: giả sử bạn muốn khách hàng có thể tạo biểu trưng cho doanh nghiệp của họ và bạn muốn đảm bảo biểu trưng luôn được tạo trên nền có màu đơn sắc. Bạn cũng muốn giới hạn các lựa chọn mà khách hàng có thể chọn trong trình đơn.

Trong ví dụ này, bạn có thể tạo một câu lệnh có tham số tương tự như sau:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Trong giao diện người dùng tuỳ chỉnh, khách hàng có thể nhập các tham số bằng cách sử dụng một trình đơn và giá trị mà họ chọn sẽ điền vào câu lệnh mà Imagen nhận được.

Ví dụ:

  1. Câu lệnh: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Ví dụ 1 về việc tham số hoá câu lệnh cho Imagen 3

  2. Câu lệnh: A modern logo for a software company on a solid color background. Include the text Silo.

    Ví dụ 2 về việc tham số hoá câu lệnh cho Imagen 3

  3. Câu lệnh: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Ví dụ về tham số hoá câu lệnh Imagen 3 (3)

Kỹ thuật viết câu lệnh nâng cao

Hãy sử dụng các ví dụ sau để tạo câu lệnh cụ thể hơn dựa trên các thuộc tính như nội dung mô tả về nhiếp ảnh, hình dạng và chất liệu, các phong trào nghệ thuật trong lịch sử và các đối tượng sửa đổi chất lượng hình ảnh.

Nhiếp ảnh

  • Câu lệnh bao gồm: "Một bức ảnh về..."

Để sử dụng kiểu này, hãy bắt đầu bằng cách dùng các từ khoá cho Imagen biết rõ rằng bạn đang tìm kiếm một bức ảnh. Bắt đầu câu lệnh bằng "Một bức ảnh về. . .". Ví dụ:

photorealistic sample image 1
Câu lệnh: Ảnh chụp hạt cà phê trong bếp trên bề mặt gỗ
photorealistic sample image 2
Câu lệnh: Ảnh chụp một thanh sô cô la trên mặt bếp
hình ảnh mẫu giống thật 3
Câu lệnh: Ảnh chụp một toà nhà hiện đại có nước ở phía sau

Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Đối tượng sửa đổi nhiếp ảnh

Trong các ví dụ sau, bạn có thể thấy một số tham số và đối tượng sửa đổi dành riêng cho nhiếp ảnh. Bạn có thể kết hợp nhiều đối tượng sửa đổi để kiểm soát chính xác hơn.

  1. Khoảng cách chụp của cameraCận cảnh, chụp từ xa

    ảnh mẫu chụp cận cảnh bằng camera
    Câu lệnh: Ảnh cận cảnh hạt cà phê
    hình ảnh mẫu thu nhỏ của camera
    Câu lệnh: Ảnh thu nhỏ của một túi nhỏ đựng
    hạt cà phê trong một căn bếp bừa bộn

  2. Vị trí cameratrên không, từ dưới lên

    ảnh mẫu chụp từ trên không
    Câu lệnh: ảnh chụp từ trên không về một thành phố đô thị có nhiều nhà cao tầng
    hình ảnh mẫu về góc nhìn từ bên dưới
    Câu lệnh: Ảnh chụp tán rừng với bầu trời xanh từ dưới lên
  3. Ánh sángtự nhiên, kịch tính, ấm áp, lạnh

    hình ảnh mẫu ánh sáng tự nhiên
    Câu lệnh: ảnh chụp trong phòng chụp ảnh về một chiếc ghế bành hiện đại, ánh sáng tự nhiên
    hình ảnh mẫu ánh sáng kịch tính
    Câu lệnh: ảnh chụp trong phòng chụp ảnh về một chiếc ghế bành hiện đại, ánh sáng kịch tính
  4. Chế độ cài đặt camera – làm mờ chuyển động, lấy nét mềm, bokeh, chân dung

    hình ảnh mẫu làm mờ chuyển động
    Câu lệnh: ảnh chụp một thành phố có các toà nhà chọc trời từ bên trong một chiếc ô tô với hiệu ứng làm mờ chuyển động
    hình ảnh mẫu có tiêu điểm mềm
    Câu lệnh: ảnh chụp lấy nét mềm một cây cầu trong thành phố vào ban đêm
  5. Loại ống kính35 mm, 50 mm, mắt cá, góc rộng, macro

    hình ảnh mẫu chụp bằng ống kính macro
    Câu lệnh: ảnh chụp một chiếc lá, ống kính macro
    hình ảnh mẫu chụp bằng ống kính mắt cá
    Câu lệnh: nhiếp ảnh đường phố, thành phố New York, ống kính mắt cá
  6. Loại phimđen trắng, polaroid

    hình ảnh mẫu về ảnh polaroid
    Câu lệnh: ảnh chân dung theo phong cách Polaroid của một chú chó đeo kính râm
    ảnh mẫu đen trắng
    Câu lệnh: ảnh đen trắng về một chú chó đeo kính râm

Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Hình minh hoạ và nghệ thuật

  • Câu lệnh có: "Một painting của...", "Một sketch của..."

Phong cách nghệ thuật đa dạng từ phong cách đơn sắc như bản phác thảo bằng bút chì, đến nghệ thuật số siêu thực. Ví dụ: các hình ảnh sau đây sử dụng cùng một câu lệnh nhưng có các kiểu khác nhau:

"Một [art style or creation technique] về chiếc xe sedan điện thể thao góc cạnh với các toà nhà chọc trời ở phía sau"

hình ảnh mẫu về tác phẩm nghệ thuật
Câu lệnh: Bản vẽ kỹ thuật bằng bút chì về một...
hình ảnh mẫu về tác phẩm nghệ thuật
Câu lệnh: Bức vẽ than về một...
hình ảnh mẫu về tác phẩm nghệ thuật
Câu lệnh: Bức vẽ bằng bút chì màu về một...
hình ảnh mẫu về tác phẩm nghệ thuật
Câu lệnh: Một bức tranh vẽ bằng phấn màu về một...
hình ảnh mẫu về tác phẩm nghệ thuật
Câu lệnh: Nghệ thuật kỹ thuật số về một...
hình ảnh mẫu về tác phẩm nghệ thuật
Câu lệnh: Một bức áp phích theo phong cách art deco về một...

Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh dạng văn bản tương ứng với mô hình Imagen 2.

Hình dạng và chất liệu
  • Câu lệnh có: "...làm bằng...", "...có hình dạng..."

Một trong những điểm mạnh của công nghệ này là bạn có thể tạo ra những hình ảnh khó hoặc không thể tạo được bằng cách khác. Ví dụ: bạn có thể tạo lại biểu trưng công ty bằng nhiều chất liệu và kết cấu.

hình ảnh ví dụ về hình dạng và chất liệu 1
Câu lệnh: một chiếc túi du lịch làm bằng pho mát
hình ảnh ví dụ 2 về hình dạng và chất liệu
Câu lệnh: ống neon có hình dạng của một con chim
hình ảnh ví dụ 3 về hình dạng và vật liệu
Câu lệnh: một chiếc ghế bành làm bằng giấy, ảnh chụp trong phòng chụp ảnh, phong cách origami

Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Tài liệu tham khảo về nghệ thuật trong quá khứ

  • Câu lệnh có chứa: "...theo phong cách..."

Một số phong cách đã trở thành biểu tượng qua nhiều năm. Sau đây là một số ý tưởng về phong cách hội hoạ hoặc nghệ thuật trong lịch sử mà bạn có thể thử.

"tạo một hình ảnh theo phong cách của [art period or movement] : một trang trại gió"

hình ảnh ví dụ về trường phái ấn tượng
Câu lệnh: tạo một hình ảnh theo phong cách bức tranh theo trường phái ấn tượng: một trang trại điện gió
hình ảnh ví dụ về thời kỳ Phục hưng
Câu lệnh: tạo một hình ảnh theo phong cách tranh thời Phục hưng: một trang trại gió
hình ảnh ví dụ về nghệ thuật đại chúng
Câu lệnh: tạo một hình ảnh theo phong cách nghệ thuật đại chúng: một trang trại điện gió

Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Các tham số sửa đổi chất lượng hình ảnh

Một số từ khoá có thể cho mô hình biết rằng bạn đang tìm kiếm một thành phần chất lượng cao. Sau đây là một số ví dụ về hệ số điều chỉnh chất lượng:

  • Đối tượng sửa đổi chungchất lượng cao, đẹp, cách điệu
  • Ảnh4K, HDR, ảnh chụp trong phòng chụp
  • Nghệ thuật, Hình minh hoạdo một chuyên gia tạo ra, có độ chi tiết cao

Sau đây là một vài ví dụ về câu lệnh không có công cụ sửa đổi chất lượng và câu lệnh tương tự có công cụ sửa đổi chất lượng.

ví dụ về hình ảnh bắp không có đối tượng sửa đổi
Câu lệnh (không có bộ sửa đổi chất lượng): ảnh chụp một cây ngô
hình ảnh mẫu về bắp có đối tượng sửa đổi
Câu lệnh (có bộ sửa đổi chất lượng): Ảnh 4K HDR tuyệt đẹp
về một cây ngô do một
nhiếp ảnh gia chuyên nghiệp chụp

Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh dạng văn bản tương ứng với mô hình Imagen 3.

Tỷ lệ khung hình

Tính năng tạo hình ảnh của Imagen cho phép bạn đặt 5 tỷ lệ khung hình riêng biệt.

  1. Vuông (1:1, mặc định) – Ảnh vuông tiêu chuẩn. Tỷ lệ khung hình này thường được dùng cho bài đăng trên mạng xã hội.
  2. Toàn màn hình (4:3) – Tỷ lệ khung hình này thường được dùng trong nội dung nghe nhìn hoặc phim. Đây cũng là kích thước của hầu hết các TV cũ (không phải màn hình rộng) và máy ảnh định dạng trung bình. Tỷ lệ này chụp được nhiều cảnh hơn theo chiều ngang (so với tỷ lệ 1:1), khiến đây trở thành tỷ lệ khung hình được ưu tiên cho nhiếp ảnh.

    ví dụ về tỷ lệ khung hình
    Câu lệnh: cận cảnh ngón tay của một nhạc sĩ đang chơi đàn piano, phim đen trắng, cổ điển (tỷ lệ khung hình 4:3)
    ví dụ về tỷ lệ khung hình
    Câu lệnh: Bức ảnh chuyên nghiệp chụp khoai tây chiên trong phòng thu cho một nhà hàng cao cấp, theo phong cách của một tạp chí ẩm thực (tỷ lệ khung hình 4:3)
  3. Toàn màn hình dọc (3:4) – Đây là tỷ lệ khung hình toàn màn hình được xoay 90 độ. Nhờ đó, bạn có thể chụp được nhiều cảnh hơn theo chiều dọc so với tỷ lệ khung hình 1:1.

    ví dụ về tỷ lệ khung hình
    Câu lệnh: một người phụ nữ đang đi bộ đường dài, cận cảnh đôi ủng của cô ấy phản chiếu trong một vũng nước, những ngọn núi lớn ở phía sau, theo phong cách của một quảng cáo, góc quay ấn tượng (tỷ lệ khung hình 3:4)
    ví dụ về tỷ lệ khung hình
    Câu lệnh: cảnh quay từ trên không về một dòng sông chảy qua một thung lũng huyền bí (tỷ lệ khung hình 3:4)
  4. Màn hình rộng (16:9) – Tỷ lệ này đã thay thế tỷ lệ 4:3 và hiện là tỷ lệ khung hình phổ biến nhất cho TV, màn hình và màn hình điện thoại di động (chế độ ngang). Hãy sử dụng tỷ lệ khung hình này khi bạn muốn chụp nhiều cảnh nền hơn (ví dụ: cảnh quan thiên nhiên).

    ví dụ về tỷ lệ khung hình
    Câu lệnh: một người đàn ông mặc quần áo toàn màu trắng đang ngồi trên bãi biển, cận cảnh, ánh sáng rực rỡ lúc "giờ vàng" (tỷ lệ khung hình 16:9)
  5. Dọc (9:16) – Tỷ lệ này là tỷ lệ màn hình rộng nhưng được xoay. Đây là một tỷ lệ khung hình tương đối mới và được các ứng dụng video ngắn (ví dụ: YouTube Shorts) ưa chuộng. Sử dụng chế độ này cho các vật thể cao có hướng dọc rõ rệt như toà nhà, cây cối, thác nước hoặc các vật thể tương tự khác.

    ví dụ về tỷ lệ khung hình
    Câu lệnh: hình ảnh kỹ thuật số của một toà nhà chọc trời đồ sộ, hiện đại, hoành tráng, hùng vĩ với cảnh hoàng hôn tuyệt đẹp ở phía sau (tỷ lệ khung hình 9:16)

Hình ảnh chân thực

Các phiên bản khác nhau của mô hình tạo hình ảnh có thể cung cấp cả đầu ra mang tính nghệ thuật và chân thực như ảnh chụp. Hãy sử dụng những từ ngữ sau trong câu lệnh để tạo ra kết quả chân thực hơn, dựa trên chủ đề mà bạn muốn tạo.

Trường hợp sử dụng Loại ống kính Tiêu cự Thông tin chi tiết khác
Người (ảnh chân dung) Ống kính cố định, ống kính thu phóng 24-35mm phim đen trắng, phim noir, độ sâu trường ảnh, song sắc (nêu 2 màu)
Thực phẩm, côn trùng, thực vật (đồ vật, tĩnh vật) Macro 60-105mm Độ chi tiết cao, lấy nét chính xác, ánh sáng được kiểm soát
Thể thao, động vật hoang dã (chuyển động) Thu phóng bằng ống kính chụp xa 100-400mm Tốc độ màn trập nhanh, theo dõi hành động hoặc chuyển động
Thiên văn học, phong cảnh (góc rộng) Ống kính góc rộng 10-24mm Thời gian phơi sáng lâu, tiêu cự sắc nét, phơi sáng lâu, nước hoặc mây mịn
Chân dung
Trường hợp sử dụng Loại ống kính Tiêu cự Thông tin chi tiết khác
Người (ảnh chân dung) Ống kính cố định, ống kính thu phóng 24-35mm phim đen trắng, phim noir, độ sâu trường ảnh, song sắc (nêu 2 màu)

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra các bức chân dung sau:

ví dụ về ảnh chân dung ví dụ về ảnh chân dung ví dụ về ảnh chân dung ví dụ về ảnh chân dung

Câu lệnh: Một phụ nữ, ảnh chân dung 35 mm, tông màu kép xanh dương và xám
Mô hình: imagen-3.0-generate-002

ví dụ về ảnh chân dung ví dụ về ảnh chân dung ví dụ về ảnh chân dung ví dụ về ảnh chân dung

Câu lệnh: Một phụ nữ, ảnh chân dung 35 mm, phim noir
Người mẫu: imagen-3.0-generate-002

Đối tượng
Trường hợp sử dụng Loại ống kính Tiêu cự Thông tin chi tiết khác
Thực phẩm, côn trùng, thực vật (đồ vật, tĩnh vật) Macro 60-105mm Độ chi tiết cao, lấy nét chính xác, ánh sáng được kiểm soát

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo các hình ảnh đối tượng sau:

ví dụ về chụp ảnh vật thể ví dụ về chụp ảnh vật thể ví dụ về chụp ảnh vật thể ví dụ về chụp ảnh vật thể

Câu lệnh: lá của cây cầu nguyện, ống kính macro, 60mm
Mô hình: imagen-3.0-generate-002

ví dụ về chụp ảnh vật thể ví dụ về chụp ảnh vật thể ví dụ về chụp ảnh vật thể ví dụ về chụp ảnh vật thể

Câu lệnh: một đĩa mì ống, ống kính macro 100 mm
Mô hình: imagen-3.0-generate-002

Có chuyển động
Trường hợp sử dụng Loại ống kính Tiêu cự Thông tin chi tiết khác
Thể thao, động vật hoang dã (chuyển động) Thu phóng bằng ống kính chụp xa 100-400mm Tốc độ màn trập nhanh, theo dõi hành động hoặc chuyển động

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra những hình ảnh chuyển động sau:

ví dụ về ảnh chuyển động ví dụ về ảnh chuyển động ví dụ về ảnh chuyển động ví dụ về ảnh chuyển động

Câu lệnh: một pha tiếp bóng thành công, tốc độ màn trập nhanh, theo dõi chuyển động
Mô hình: imagen-3.0-generate-002

ví dụ về ảnh chuyển động ví dụ về ảnh chuyển động ví dụ về ảnh chuyển động ví dụ về ảnh chuyển động

Câu lệnh: Một chú hươu đang chạy trong rừng, tốc độ màn trập nhanh, theo dõi chuyển động
Mô hình: imagen-3.0-generate-002

Ống kính góc rộng
Trường hợp sử dụng Loại ống kính Tiêu cự Thông tin chi tiết khác
Thiên văn học, phong cảnh (góc rộng) Ống kính góc rộng 10-24mm Thời gian phơi sáng lâu, tiêu cự sắc nét, phơi sáng lâu, nước hoặc mây mịn

Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra những hình ảnh góc rộng sau:

ví dụ về ảnh góc rộng ví dụ về ảnh góc rộng ví dụ về ảnh góc rộng ví dụ về ảnh góc rộng

Câu lệnh: một dãy núi rộng lớn, phong cảnh góc rộng 10 mm
Mô hình: imagen-3.0-generate-002

ví dụ về ảnh góc rộng ví dụ về ảnh góc rộng ví dụ về ảnh góc rộng ví dụ về ảnh góc rộng

Câu lệnh: a photo of the moon, astro photography, wide angle 10mm (ảnh chụp mặt trăng, ảnh thiên văn, góc rộng 10 mm)
Mô hình: imagen-3.0-generate-002

Phiên bản mô hình

Imagen 4

Thuộc tính Mô tả
Mã kiểu máy

Gemini API

imagen-4.0-generate-001
imagen-4.0-ultra-generate-001
imagen-4.0-fast-generate-001

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Hình ảnh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

480 mã thông báo (văn bản)

Hình ảnh đầu ra

1 đến 4 (Ultra/Standard/Fast)

Thông tin cập nhật mới nhất Tháng 6 năm 2025

Imagen 3

Thuộc tính Mô tả
Mã kiểu máy

Gemini API

imagen-3.0-generate-002

Các loại dữ liệu được hỗ trợ

Input

Văn bản

Đầu ra

Hình ảnh

Giới hạn mã thông báo[*]

Giới hạn mã thông báo đầu vào

Không có

Hình ảnh đầu ra

Tối đa 4

Thông tin cập nhật mới nhất Tháng 2 năm 2025