爱科技、爱创意、爱折腾、爱极致,我们都是技术控
您需要 登录 才可以下载或查看,没有账号?立即注册
x
科技媒体 NeoWin (10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。 IT之家曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。 相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊天、转录和长文本翻译任务。 Gemini 1.5 Flash 8B 的另一个亮点是亲民的价格,相关计费将于 10 月 14 日星期一生效,IT之家附上相关信息如下: - 在低于 128K 上下文窗口下,每百万 tokens 输入提示词费用为 0.0375 美元(当前约 0.26 元人民币)
- 在低于 128K 上下文窗口下,每百万 tokens 输出提示词费用为 0.15 美元(当前约 1.1 元人民币)
- 在低于 128K 上下文窗口下,每百万 tokens 缓存提示词费用为 0.01 美元(当前约 0.071 元人民币)
作为对比,Gemini 1.5 Flash 模型的每百万输出 tokens 成本为 0.3 美元,这一价格是在 2024 年 8 月 12 日开始实施的,意味着新版 Gemini 1.5 Flash 8B 的价格相比较原版直接腰斩。
|