Модели Близнецов

Варианты модели

Gemini API предлагает различные модели, оптимизированные для конкретных случаев использования. Вот краткий обзор доступных вариантов Gemini:

Вариант модели Вход(ы) Выход Оптимизирован для
Близнецы 2.0 Флэш
gemini-2.0-flash
Аудио, изображения, видео и текст Текст, изображения (скоро) и аудио (скоро) Функции нового поколения, скорость и мультимодальная генерация для самых разных задач.
Предварительный просмотр Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05
Аудио, изображения, видео и текст Текст Модель Gemini 2.0 Flash, оптимизированная для обеспечения экономической эффективности и низкой задержки.
Близнецы 1.5 Флэш
gemini-1.5-flash
Аудио, изображения, видео и текст Текст Быстрая и универсальная производительность при выполнении широкого спектра задач.
Близнецы 1.5 Флэш-8Б
gemini-1.5-flash-8b
Аудио, изображения, видео и текст Текст Задачи большого объема и низкого интеллекта
Близнецы 1.5 Про
gemini-1.5-pro
Аудио, изображения, видео и текст Текст Сложные логические задачи, требующие большего интеллекта
Встраивание текста
text-embedding-004
Текст Встраивание текста Измерение связанности текстовых строк

Ограничения ставок для каждой модели можно просмотреть на странице ограничений ставок .

Близнецы 2.0 Флэш

Gemini 2.0 Flash предоставляет функции и улучшенные возможности следующего поколения, включая превосходную скорость, использование собственных инструментов, мультимодальную генерацию и контекстное окно токена 1M.

Попробуйте в Google AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-2.0-flash
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Аудио (скоро), изображения (скоро) и текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Возможности

Структурированные результаты

Поддерживается

Кэширование

Вскоре

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Выполнение кода

Поддерживается

Поиск

Поддерживается

Генерация изображений

Вскоре

Использование собственного инструмента

Поддерживается

Генерация звука

Вскоре

Мультимодальный Live API

Вскоре

версии
Более подробную информацию можно найти в шаблонах версий модели .
  • Последняя версия: gemini-2.0-flash
  • Стабильная версия: gemini-2.0-flash-001
Последнее обновление февраль 2025 г.
Прекращение знаний август 2024 г.

Предварительный просмотр Gemini 2.0 Flash-Lite

Модель Gemini 2.0 Flash, оптимизированная для обеспечения экономической эффективности и низкой задержки.

Попробуйте в Google AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-2.0-flash-lite-preview-02-05
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Возможности

Структурированные результаты

Поддерживается

Кэширование

Не поддерживается

Тюнинг

Не поддерживается

Вызов функции

Не поддерживается

Выполнение кода

Не поддерживается

Поиск

Не поддерживается

Генерация изображений

Не поддерживается

Использование собственного инструмента

Не поддерживается

Генерация звука

Не поддерживается

Мультимодальный Live API

Не поддерживается

версии
Более подробную информацию можно найти в шаблонах версий модели .
  • Последняя версия: gemini-2.0-flash-lite-preview-02-05
Последнее обновление февраль 2025 г.
Прекращение знаний август 2024 г.

Близнецы 1.5 Флэш

Gemini 1.5 Flash — быстрая и универсальная мультимодальная модель для масштабирования под самые разнообразные задачи.

Попробуйте в Google AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-flash
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

3600

Максимальная длина видео

1 час

Максимальная длина звука

Примерно 9,5 часов

Возможности

Системные инструкции

Поддерживается

JSON-режим

Поддерживается

Схема JSON

Поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Поддерживается

Вызов функции

Поддерживается

Выполнение кода

Поддерживается

Двунаправленная потоковая передача

Не поддерживается

версии
Более подробную информацию можно найти в шаблонах версий модели .
  • Последний: gemini-1.5-flash-latest
  • Последняя стабильная версия: gemini-1.5-flash
  • Стабильный:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Последнее обновление Сентябрь 2024 г.

Близнецы 1.5 Флэш-8Б

Gemini 1.5 Flash-8B — небольшая модель, предназначенная для задач с невысоким интеллектом.

Попробуйте в Google AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-flash-8b
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

1 048 576

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

3600

Максимальная длина видео

1 час

Максимальная длина звука

Примерно 9,5 часов

Возможности

Системные инструкции

Поддерживается

JSON-режим

Поддерживается

Схема JSON

Поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Поддерживается

Вызов функции

Поддерживается

Выполнение кода

Поддерживается

Двунаправленная потоковая передача

Не поддерживается

версии
Более подробную информацию можно найти в шаблонах версий модели .
  • Последний: gemini-1.5-flash-8b-latest
  • Последняя стабильная версия: gemini-1.5-flash-8b
  • Стабильный:
    • gemini-1.5-flash-8b-001
Последнее обновление октябрь 2024 г.

Близнецы 1.5 Про

Gemini 1.5 Pro — это мультимодальная модель среднего размера, оптимизированная для широкого спектра задач рассуждения. 1.5 Pro может обрабатывать большие объемы данных одновременно, включая 2 часа видео, 19 часов аудио, кодовые базы с 60 000 строк кода или 2000 страниц текста.

Попробуйте в Google AI Studio

Детали модели

Свойство Описание
Код модели models/gemini-1.5-pro
Поддерживаемые типы данных

Входы

Аудио, изображения, видео и текст

Выход

Текст

Лимиты токенов [*]

Лимит входных токенов

2 097 152

Лимит выходных токенов

8,192

Аудио/видео характеристики

Максимальное количество изображений в запросе

7200

Максимальная длина видео

2 часа

Максимальная длина звука

Примерно 19 часов

Возможности

Системные инструкции

Поддерживается

Режим JSON

Поддерживается

Схема JSON

Поддерживается

Регулируемые настройки безопасности

Поддерживается

Кэширование

Поддерживается

Тюнинг

Не поддерживается

Вызов функции

Поддерживается

Выполнение кода

Поддерживается

Двунаправленная потоковая передача

Не поддерживается

версии
Более подробную информацию можно найти в шаблонах версий модели .
  • Последний: gemini-1.5-pro-latest
  • Последняя стабильная версия: gemini-1.5-pro
  • Стабильный:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Последнее обновление Сентябрь 2024 г.

Встраивание текста и встраивание

Встраивание текста

Встраивание текста используется для измерения связанности строк и широко используется во многих приложениях искусственного интеллекта.

text-embedding-004 обеспечивает более высокую производительность поиска и превосходит существующие модели сопоставимых размеров по стандартным тестам встраивания MTEB.

Детали модели
Свойство Описание
Код модели

Близнецы API

models/text-embedding-004

Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление апрель 2024 г.

Встраивание

Вы можете использовать модель внедрения для создания внедрений текста для входного текста.

Модель внедрения оптимизирована для создания внедрений с 768 измерениями для текста длиной до 2048 токенов.

Встраивание деталей модели
Свойство Описание
Код модели models/embedding-001
Поддерживаемые типы данных

Вход

Текст

Выход

Встраивание текста

Лимиты токенов [*]

Лимит входных токенов

2048

Размер выходного размера

768

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Не поддерживается
Последнее обновление декабрь 2023 г.

АКА

Вы можете использовать модель AQA для выполнения задач, связанных с атрибутивными вопросами-ответами (AQA), над документом, корпусом или набором отрывков. Модель AQA возвращает ответы на вопросы, основанные на предоставленных источниках, а также оценивает вероятность ответа.

Детали модели

Свойство Описание
Код модели models/aqa
Поддерживаемые типы данных

Вход

Текст

Выход

Текст

Поддерживаемый язык Английский
Лимиты токенов [*]

Лимит входных токенов

7,168

Лимит выходных токенов

1024

Ограничения скорости [**] 1500 запросов в минуту
Регулируемые настройки безопасности Поддерживается
Последнее обновление декабрь 2023 г.

Посмотрите примеры , чтобы изучить возможности этих вариантов модели.

[*] Токен эквивалентен примерно 4 символам для моделей Gemini. 100 токенов — это примерно 60-80 английских слов.

Шаблоны названий версий моделей

Модели Gemini доступны в предварительной или стабильной версиях. В своем коде вы можете использовать один из следующих форматов имени модели, чтобы указать, какую модель и версию вы хотите использовать.

  • Последняя: указывает на новейшую версию модели для указанного поколения и модификации. Базовая модель регулярно обновляется и может представлять собой предварительную версию. Этот псевдоним следует использовать только в приложениях и прототипах исследовательского тестирования.

    Чтобы указать последнюю версию, используйте следующий шаблон: <model>-<generation>-<variation>-latest . Например, gemini-1.0-pro-latest .

  • Последняя стабильная версия: указывает на самую последнюю стабильную версию, выпущенную для указанного поколения и варианта модели.

    Чтобы указать последнюю стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation> . Например, gemini-1.0-pro .

  • Стабильная: указывает на конкретную стабильную модель. Стабильные модели не меняются. Большинство производственных приложений должны использовать определенную стабильную модель.

    Чтобы указать стабильную версию, используйте следующий шаблон: <model>-<generation>-<variation>-<version> . Например, gemini-1.0-pro-001 .

  • Экспериментальная модель. Указывает на экспериментальную модель, доступную в предварительной версии, как определено в Условиях , что означает, что она не предназначена для промышленного использования. Мы выпускаем экспериментальные модели, чтобы собрать отзывы, быстро передать последние обновления разработчикам и подчеркнуть темпы инноваций, происходящих в Google. То, что мы узнаем из экспериментальных запусков, помогает нам выпускать модели более широко. Экспериментальная модель может быть заменена на другую без предварительного уведомления. Мы не гарантируем, что экспериментальная модель станет стабильной в будущем.

    Чтобы указать экспериментальную версию, используйте следующий шаблон: <model>-<generation>-<variation>-<version> . Например, gemini-exp-1121 .

Доступные языки

Модели Gemini обучены работе со следующими языками:

  • арабский ( ar )
  • Бенгальский ( bn )
  • Болгарский ( bg )
  • Китайский упрощенный и традиционный ( zh )
  • Хорватский ( hr )
  • Чешский ( cs )
  • датский ( da )
  • Голландский ( nl )
  • английский ( en )
  • Эстонский ( et )
  • финский ( fi )
  • французский ( fr .)
  • немецкий ( de )
  • Греческий ( el )
  • Иврит ( iw )
  • Хинди ( hi )
  • венгерский ( hu )
  • Индонезийский ( id )
  • Итальянский ( it )
  • японский ( ja )
  • Корейский ( ko )
  • Латышский ( lv )
  • Литовский ( lt )
  • Норвежский ( no )
  • польский ( pl )
  • Португальский ( pt )
  • Румынский ( ro )
  • Русский ( ru )
  • Сербский ( sr )
  • словацкий ( sk )
  • Словенский ( sl )
  • Испанский ( es )
  • Суахили ( sw )
  • Шведский ( sv )
  • тайский ( th )
  • турецкий ( tr )
  • Украинский ( uk )
  • Вьетнамский ( vi )