Kimi 开放平台上下文缓存功能公测:降低最高 90% 的使用成本
嘿,你知道吗?系统之家的月之暗面 Kimi 开放平台最近开了个上下文缓存的功能,正在公测呢!这个功能特别适合那些经常需要请求、引用大量初始上下文的场景,可以帮你省下不少钱,而且还能提高效率哦!官方说,最多能省下 90% 的费用,首 Token 延迟也能减少 83%,让你的模型响应速度更快哦!怎么样,是不是很赞啊?
系统之家附 Kimi 开放平台上下文缓存功能公测详情如下:
技术简介
据介绍,上下文缓存是一种数据管理技术,允许系统预先存储会被频繁请求的大量数据或信息。当用户请求相同信息时,系统可以直接从缓存中提供,无需重新计算或从原始数据源中检索。
适用场景
适用业务场景如下:
提供大量预设内容的 QA Bot,例如 Kimi API 小助手
针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具
对静态代码库或知识库的周期性分析,例如各类 Copilot Agent
瞬时流量巨大的爆款 AI 应用,例如哄哄模拟器,LLM Riddles
交互规则复杂的 Agent 类应用等
计费说明
上下文缓存收费模式主要分为以下三个部分:
Cache 创建费用
调用 Cache 创建接口,成功创建 Cache 后,按照 Cache 中 Tokens 按实际量计费。24 元 / M token
Cache 存储费用
Cache 存活时间内,按分钟收取 Cache 存储费用。10 元 / M token / 分钟
Cache 调用费用
Cache 调用增量 token 的收费:按模型原价收费
Cache 调用次数收费:Cache 存活时间内,用户通过 chat 接口请求已创建成功的 Cache,若 chat message 内容与存活中的 Cache 匹配成功,将按调用次数收取 Cache 调用费用。0.02 元 / 次
公测时间和资格说明
公测时间:功能上线后,公测 3 个月,公测期价格可能随时调整。
公测资格:公测期间 Context Caching 功能优先开放给 Tier5 等级用户,其他用户范围放开时间待定。
以上是系统之家提供的最新资讯,感谢您的阅读,更多精彩内容请关注系统之家官网。
相关阅读
-
win10怎么快速关闭屏幕?win10快速关闭屏幕方法
估计很多用 Win10 的人都会想要快速锁屏来保护个人隐私,但是也有人不知道怎么快速关掉屏幕。其实很简单,你可以直接按 Win + L 快捷键,或者右键点击桌面上的空白地方,然后选择快捷方式就可以啦。下面我们就来详细说一下 Win10 快速
-
英特尔发布 101.5971 版 Arc 显卡驱动,优化《黑神话:悟空》《魔兽世界:地心之战》游戏性能
系统之家消息,英特尔发布了最新的 Graphics Driver 32.0.101.5971 显卡驱动(前往下载),适用于锐炫 Arc A 系列独显以及锐炬 Xe 核显。英特尔新版驱动“推荐”不再是“Windows 11 家庭版”,而是 W
-
火狐浏览器 Firefox 决定延长支持 Win7/8/8.1 系统
哥们儿,你知道吗?Mozilla 想要让火狐浏览器在 Windows 7 上再撑一会儿哦!听说他们还要把 Windows 8 和 8.1 加进来呢,不过现在还不清楚会支持多久啦。系统之家注意到,微软于 2023 年 1 月结束了对 Wind
-
win7打开软件提示此程序被组策略阻止怎么解决?
大家好,今天我们要来分享一下如何解决win7打开软件时出现“此程序被组策略阻止”的问题。相信有很多小伙伴都有遇到过这个问题,导致很多程序都无法正常运行。但是别担心,我们这就来教大家如何解决这个问题。如果你也遇到了这个问题,就赶紧来看看吧!我
-
win10系统如何解除磁盘保护?win10系统解除磁盘保护方法
有些朋友想重装系统时,发现自己的 Windows 10 电脑设了磁盘保护,结果很多文件不能写入,平时的操作也有问题。对一些新手来说,不知道该用啥办法才能取消磁盘保护。今天 Win 10 教程就来教大家怎么弄,跟我来,看看具体步骤吧!win1
-
如何在win11系统中设置虚拟内存?win11设置虚拟内存操作方法
虚拟内存可以帮我们解决一些软件内存不够的问题,让我们的电脑用起来更流畅。有些升级到win11系统的用户不知道怎么设置虚拟内存,没关系,今天系统之家的小哥哥就给大家带来了最新最全的设置教程,想要学习的小伙伴快来本站看看吧!win11设置虚拟内