数码之家

 找回密码
 立即注册
搜索
查看: 49|回复: 0

[科技] 谷歌API成本大跳水!Gemini2.5隐式缓存狂省75%

[复制链接]
发表于 昨天 22:59 | 显示全部楼层 |阅读模式
程序员们今晚加鸡腿!谷歌昨晚给自家AI接口整了个骚操作——Gemini2.5系列API突然上线"隐式缓存"功能,开发者钱包瞬间减负75%!

这个黑科技简直像给AI对话装了复用外挂:只要你的提示词前半段重复出现(比如固定指令模板),系统自动就存为公共素材库。下次其他用户调用时,直接蹭现成的缓存内容计费。重点是完全不用写代码配置,默认自动开启!

新旧缓存玩法对比

老版显式缓存(去年五月发布):得手动设置"小抄本"TTL生存时间,能用在Gemini2.0/2.5上
新版隐式缓存:只在2.5 Pro/Flash生效,系统自动抓高频前缀,适合固定话术场景

薅羊毛秘笈公开
谷歌官方手把手教你怎么白嫖:把固定台词塞提示词开头,用户变量内容往后挪。举个栗子:
"您好,这里是XX客服机器人。关于您咨询的________问题..."

前面固定部分疯狂复用,后面填空部分随时换,账单打二五折!

不过要注意起薅门槛:Flash模型得攒够1024个token,Pro版要2048个token才能触发。好在响应里新增了cached_content_token_count字段,让你明明白白看省钱记录。

当然也有极客质疑:这75%是不是实验室理想数据?实际业务中变量那么多,能省三成都是赚。话说回来,有羊毛不薅王八蛋,反正不花钱的自动功能先用起来再说~(๑•̀ㅂ•́)و✧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-11 03:40 , Processed in 0.171601 second(s), 5 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表