AI资讯
Google Gemini API迎来隐式缓存功能 自动节省开发成本高达75%
近期,Google 宣布在其 Gemini API 中推出一项新功能 —— 隐式缓存。这一功能旨在帮助第三方开发者在使用最新 AI 模型时节省成本,最高可达75% 的费用节约,尤其是在处理重复性上下文时效果显著。 隐式缓存的工作原理隐式缓存的核心在于,它能够自动识别并重用之前请求中相似的内容。Google 表示,这项新功能已默认开启,适用于 Gemini2.5Pro 和2.5Flash 模型。当开发者向 Gemini2.5模型发送请求时,如果该请求与之前的某个请求存在相同的前缀,就有可能命中缓存,从而实现成本节约。与此前的