La API de Gemini puede generar un resultado de texto cuando se proporcionan texto, imágenes, video y audio como entrada.
En esta guía, se muestra cómo generar texto con los métodos generateContent y streamGenerateContent. Para obtener información sobre cómo trabajar con las capacidades de visión y audio de Gemini, consulta las guías de Vision y audio.
¿Qué sigue?
Ahora que exploraste los conceptos básicos de la API de Gemini, te recomendamos que
pruebes lo siguiente:
Comprensión visual: Aprende a usar la comprensión visual nativa de Gemini para procesar imágenes y videos.
Comprensión de audio: Aprende a usar la comprensión de audio nativa de Gemini para procesar archivos de audio.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-02-05 (UTC)"],[],[]]