|
程序员们今晚加鸡腿!谷歌昨晚给自家AI接口整了个骚操作——Gemini2.5系列API突然上线"隐式缓存"功能,开发者钱包瞬间减负75%!
这个黑科技简直像给AI对话装了复用外挂:只要你的提示词前半段重复出现(比如固定指令模板),系统自动就存为公共素材库。下次其他用户调用时,直接蹭现成的缓存内容计费。重点是完全不用写代码配置,默认自动开启!
新旧缓存玩法对比
老版显式缓存(去年五月发布):得手动设置"小抄本"TTL生存时间,能用在Gemini2.0/2.5上
新版隐式缓存:只在2.5 Pro/Flash生效,系统自动抓高频前缀,适合固定话术场景
薅羊毛秘笈公开
谷歌官方手把手教你怎么白嫖:把固定台词塞提示词开头,用户变量内容往后挪。举个栗子:
"您好,这里是XX客服机器人。关于您咨询的________问题..."
前面固定部分疯狂复用,后面填空部分随时换,账单打二五折!
不过要注意起薅门槛:Flash模型得攒够1024个token,Pro版要2048个token才能触发。好在响应里新增了cached_content_token_count字段,让你明明白白看省钱记录。
当然也有极客质疑:这75%是不是实验室理想数据?实际业务中变量那么多,能省三成都是赚。话说回来,有羊毛不薅王八蛋,反正不花钱的自动功能先用起来再说~(๑•̀ㅂ•́)و✧
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|