2.0 Flash
Notre tout dernier modèle multimodal, avec des fonctionnalités de nouvelle génération et des fonctionnalités améliorées
- Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
- Générer du code, extraire des données, analyser des fichiers, générer des graphiques, etc.
- Faible latence, performances améliorées, conçu pour alimenter des expériences d'agentivité
2.0 Flash-Lite
Un modèle Gemini 2.0 Flash optimisé pour la rentabilité et la faible latence
- Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
- Surperforme 1.5 Flash dans la majorité des benchmarks
- Fenêtre de contexte d'un million de jetons et entrée multimodale, comme Flash 2.0
1.5 Flash
Notre modèle multimodal le plus équilibré, offrant d'excellentes performances pour la plupart des tâches
- Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
- Générer du code, extraire des données, modifier du texte, etc.
- Idéal pour les tâches qui équilibrent performances et coûts
Variantes du modèle
L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Voici un bref aperçu des variantes de Gemini disponibles:
Variante du modèle | Entrées | Sortie | Optimisé pour |
---|---|---|---|
Gemini 2.0 Flash
gemini-2.0-flash |
Audio, images, vidéos et texte | Texte, images (bientôt disponibles) et audio (bientôt disponibles) | Fonctionnalités de nouvelle génération, vitesse et génération multimodale pour une grande variété de tâches |
Preview de Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-preview-02-05 |
Audio, images, vidéos et texte | Texte | Un modèle Gemini 2.0 Flash optimisé pour la rentabilité et la faible latence |
Gemini 1.5 Flash
gemini-1.5-flash |
Audio, images, vidéos et texte | Texte | Performances rapides et polyvalentes pour diverses tâches |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Audio, images, vidéos et texte | Texte | Tâches à fort volume et à faible intelligence |
Gemini 1.5 Pro
gemini-1.5-pro |
Audio, images, vidéos et texte | Texte | Tâches de raisonnement complexes nécessitant plus d'intelligence |
Embedding textuel
text-embedding-004 |
Texte | Embeddings textuels | Mesurer la relation entre des chaînes de texte |
Vous pouvez consulter les limites de débit pour chaque modèle sur la page des limites de débit.
Gemini 2.0 Flash
Gemini 2.0 Flash offre des fonctionnalités de nouvelle génération et des fonctionnalités améliorées, y compris une vitesse supérieure, l'utilisation d'outils natifs, la génération multimodale et une fenêtre de contexte d'un million de jetons.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-2.0-flash |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Audio (bientôt disponible), images (bientôt disponibles) et texte |
[*] | Limites de jeton
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Fonctionnalités de |
Sorties structurées Compatible Mise en cache Bientôt disponible Accordage Not supported Appel de fonction Compatible Exécution du code Compatible Rechercher Compatible Génération d'images Bientôt disponible Utilisation d'un outil natif Compatible Génération audio Bientôt disponible API Multimodal Live Bientôt disponible |
Versions |
|
Dernière mise à jour | Février 2025 |
Seuil de connaissance | Août 2024 |
Preview de Gemini 2.0 Flash-Lite
Modèle Gemini 2.0 Flash optimisé pour la rentabilité et la faible latence.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-2.0-flash-lite-preview-02-05 |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Fonctionnalités de |
Sorties structurées Compatible Mise en cache Not supported Accordage Not supported Appel de fonction Not supported Exécution du code Not supported Rechercher Not supported Génération d'images Not supported Utilisation d'un outil natif Not supported Génération audio Not supported API Multimodal Live Not supported |
Versions |
|
Dernière mise à jour | Février 2025 |
Seuil de connaissance | Août 2024 |
Gemini 1.5 Flash
Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent, adapté à un large éventail de tâches.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.5-flash |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Caractéristiques audio/visuelles |
Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée audio maximale Environ 9,5 heures |
Fonctionnalités de |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Compatible Appel de fonction Compatible Exécution du code Compatible Streaming bidirectionnel Not supported |
Versions |
|
Dernière mise à jour | Septembre 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B est un petit modèle conçu pour les tâches d'intelligence de moindre envergure.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.5-flash-8b |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Caractéristiques audio/visuelles |
Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée audio maximale Environ 9,5 heures |
Fonctionnalités de |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Compatible Appel de fonction Compatible Exécution du code Compatible Streaming bidirectionnel Not supported |
Versions |
|
Dernière mise à jour | Octobre 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données en même temps, y compris deux heures de vidéo, 19 heures d'audio, des codebases de 60 000 lignes de code ou 2 000 pages de texte.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.5-pro |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 2 097 152 Limite de jetons de sortie 8 192 |
Caractéristiques audio/visuelles |
Nombre maximal d'images par requête 7 200 Durée maximale de la vidéo 2 heures Durée audio maximale Environ 19 heures |
Fonctionnalités de |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Not supported Appel de fonction Compatible Exécution du code Compatible Streaming bidirectionnel Not supported |
Versions |
|
Dernière mise à jour | Septembre 2024 |
Embedding textuel et embeddings
Embedding textuel
Les embeddings de texte sont utilisés pour mesurer la relation entre les chaînes et sont largement utilisés dans de nombreuses applications d'IA.
text-embedding-004
offre des meilleures performances de récupération et surpasse les modèles existants avec des dimensions comparables, sur les benchmarks d'encapsulation MTEB standards.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle |
API Gemini
|
Types de données acceptés |
Entrée Texte Sortie Embeddings textuels |
[*] | Limites de jeton
Limite de jetons d'entrée 2 048 Taille de la dimension de sortie 768 |
[**] | Limites de débit1 500 requêtes par minute |
Not supported | |
Dernière mise à jour | Avril 2024 |
Embedding
Vous pouvez utiliser le modèle d'embedding pour générer des embeddings de texte pour le texte d'entrée.
Le modèle d'embedding est optimisé pour créer des embeddings à 768 dimensions pour un texte de 2 048 jetons maximum.
Détails du modèle d'embedding
Propriété | Description |
---|---|
: code du modèle |
models/embedding-001
|
Types de données acceptés |
Entrée Texte Sortie Embeddings textuels |
[*] | Limites de jeton
Limite de jetons d'entrée 2 048 Taille de la dimension de sortie 768 |
[**] | Limites de débit1 500 requêtes par minute |
Not supported | |
Dernière mise à jour | Décembre 2023 |
AQA
Vous pouvez utiliser le modèle AQA pour effectuer des tâches liées à la résolution de questions attribuée (AQA) sur un document, un corpus ou un ensemble de passages. Le modèle AQA renvoie des réponses aux questions basées sur les sources fournies, ainsi qu'une estimation de la probabilité de réponse.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/aqa |
Types de données acceptés |
Entrée Texte Sortie Texte |
Langue prise en charge | Anglais |
[*] | Limites de jeton
Limite de jetons d'entrée 7,168 Limite de jetons de sortie 1 024 |
[**] | Limites de débit1 500 requêtes par minute |
Compatible | |
Dernière mise à jour | Décembre 2023 |
Consultez les exemples pour découvrir les fonctionnalités de ces variantes de modèle.
[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons correspondent à environ 60-80 mots en anglais.
Modèles de nom de version de modèle
Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.
Dernière:indique la version la plus récente du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut s'agir d'une version Preview. Seuls les prototypes et les applications de test exploratoire doivent utiliser cet alias.
Pour spécifier la dernière version, utilisez le format suivant :
<model>-<generation>-<variation>-latest
. Exemple :gemini-1.0-pro-latest
.Dernière version stable:pointe vers la dernière version stable publiée pour la génération et la variation de modèle spécifiées.
Pour spécifier la dernière version stable, utilisez le format suivant :
<model>-<generation>-<variation>
. Exemple :gemini-1.0-pro
Stable:indique un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.
Pour spécifier une version stable, utilisez le format suivant :
<model>-<generation>-<variation>-<version>
. Exemple :gemini-1.0-pro-001
.Expérimental:fait référence à un modèle expérimental disponible en version Preview, comme défini dans les Conditions. Il n'est donc pas destiné à une utilisation en production. Nous lançons des modèles expérimentaux pour recueillir des commentaires, mettre rapidement nos dernières nouveautés entre les mains des développeurs et mettre en avant le rythme d'innovation de Google. Les enseignements que nous tirons des lancements expérimentaux déterminent la façon dont nous déployons plus largement les modèles. Un modèle expérimental peut être remplacé par un autre sans préavis. Nous ne garantissons pas qu'un modèle expérimental deviendra un modèle stable à l'avenir.
Pour spécifier une version expérimentale, utilisez le format suivant :
<model>-<generation>-<variation>-<version>
. Exemple :gemini-exp-1121
.
Langues disponibles
Les modèles Gemini sont entraînés pour fonctionner avec les langues suivantes:
- Arabe (
ar
) - Bengalî (
bn
) - Bulgare (
bg
) - Chinois simplifié et traditionnel (
zh
) - Croate (
hr
) - République tchèque (
cs
) - Danois (
da
) - Néerlandais (
nl
) - Anglais (
en
) - Estonien (
et
) - Finnois (
fi
) - Français (
fr
) - Allemand (
de
) - Grec (
el
) - Hébreu (
iw
) - Hindi (
hi
) - Hongrois (
hu
) - Indonésien (
id
) - Italien (
it
) - Japonais (
ja
) - Coréen (
ko
) - Letton (
lv
) - Lituanien (
lt
) - Norvégien (
no
) - Polonais (
pl
) - Portugais (
pt
) - Roumain (
ro
) - Russe (
ru
) - Serbe (
sr
) - Slovaque (
sk
) - Slovène (
sl
) - Espagnol (
es
) - Swahili (
sw
) - Suédois (
sv
) - Thaï (
th
) - Turc (
tr
) - Ukrainien (
uk
) - Vietnamien (
vi
)