谷歌API成本大跳水！Gemini2.5隐式缓存狂省75%

Meise · 发表于 2025-5-10 22:59:10

程序员们今晚加鸡腿！谷歌昨晚给自家AI接口整了个骚操作——Gemini2.5系列API突然上线"隐式缓存"功能，开发者钱包瞬间减负75%！

这个黑科技简直像给AI对话装了复用外挂：只要你的提示词前半段重复出现（比如固定指令模板），系统自动就存为公共素材库。下次其他用户调用时，直接蹭现成的缓存内容计费。重点是完全不用写代码配置，默认自动开启！

新旧缓存玩法对比

老版显式缓存（去年五月发布）：得手动设置"小抄本"TTL生存时间，能用在Gemini2.0/2.5上
新版隐式缓存：只在2.5 Pro/Flash生效，系统自动抓高频前缀，适合固定话术场景

薅羊毛秘笈公开
谷歌官方手把手教你怎么白嫖：把固定台词塞提示词开头，用户变量内容往后挪。举个栗子：
"您好，这里是XX客服机器人。关于您咨询的________问题..."

前面固定部分疯狂复用，后面填空部分随时换，账单打二五折！

不过要注意起薅门槛：Flash模型得攒够1024个token，Pro版要2048个token才能触发。好在响应里新增了cached_content_token_count字段，让你明明白白看省钱记录。

当然也有极客质疑：这75%是不是实验室理想数据？实际业务中变量那么多，能省三成都是赚。话说回来，有羊毛不薅王八蛋，反正不花钱的自动功能先用起来再说～(๑•̀ㅂ•́)و✧

账号		自动登录	找回密码
密码			立即注册

[科技] 谷歌API成本大跳水！Gemini2.5隐式缓存狂省75%

本帖子中包含更多资源

相关帖子