Bağlamı önbelleğe alma

Tipik bir yapay zeka iş akışında, aynı giriş jetonlarını bir modele tekrar tekrar iletebilirsiniz. Gemini API, performansı ve maliyetleri optimize etmek için örtülü önbelleğe alma özelliği sunar.

Örtülü önbelleğe alma

Örtülü önbelleğe alma, tüm Gemini 2.5 ve daha yeni modellerde varsayılan olarak etkindir. İsteğiniz önbelleğe isabet ederse maliyet tasarruflarını otomatik olarak aktarırız. Bu özelliği etkinleştirmek için yapmanız gereken bir işlem yoktur. Bağlam önbelleğe alma için minimum giriş jetonu sayısı, her model için aşağıdaki tabloda listelenmiştir:

Model Minimum jeton sınırı
Gemini 3.5 Flash 4096
Gemini 3.1 Pro Önizlemesi 4096
Gemini 2.5 Flash 2048
Gemini 2.5 Pro 2048

Örtülü önbellek isabeti olasılığını artırmak için:

  • Büyük ve yaygın içerikleri isteminizin başına eklemeyi deneyin.
  • Kısa süre içinde benzer öneklere sahip istekler göndermeye çalışıyorsunuz.

Yanıt nesnesinin usage_metadata (Python) veya usageMetadata (JavaScript) alanında önbellek isabeti olan jeton sayısını görebilirsiniz.