Interactions API 現已正式發布。建議使用這個 API，存取所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

脈絡快取

在典型的 AI 工作流程中，您可能會反覆將相同的輸入權杖傳遞至模型。Gemini API 提供隱含快取功能，可提升效能並節省費用。

隱含快取

所有 Gemini 2.5 以上版本模型都會預設啟用隱式快取功能。這項功能支援有狀態 (使用 previous_interaction_id) 和無狀態對話模式。如果要求命中快取，我們會自動轉移節省的費用。這項功能會自動啟用，您無需採取任何行動。下表列出各模型進行內容快取時的最低輸入權杖數：

如要提高隱含快取命中的機率，請採取下列行動：

您可以在回應物件的 usage.total_cached_tokens (Python 和 JavaScript) 欄位中，查看快取命中次數。