Kimi 上下文緩存功能開啟公測！降低使用費用，加快模型相應速度

Kimi 上下文緩存功能開啟公測！降低使用費用，加快模型相應速度

diannao/2025/8/15 3:06:50/文章來源:https://blog.csdn.net/lihuiyun184291/article/details/140117824

　　7月2日，系統之家發布消息，月之暗面科技有限公司旗下的Kimi開放平臺正式推出上下文緩存功能，并已開放公測。這項功能專為處理頻繁請求和大量重復引用初始上下文的場景設計，能有效降低使用長文本模型的成本，并顯著提升處理效率。據官方數據顯示，上下文緩存功能可以將費用降低至最高90%，同時將首次Token的延遲時間縮短83%，從而加快模型的響應速度。

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

　　系統之家附 Kimi 開放平臺上下文緩存功能公測詳情如下：

? ? ? 技術簡介

　　據介紹，上下文緩存是一種數據管理技術，允許系統預先存儲會被頻繁請求的大量數據或信息。當用戶請求相同信息時，系統可以直接從緩存中提供，無需重新計算或從原始數據源中檢索。

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

? ? ?適用場景

　　適用業務場景如下：

　　提供大量預設內容的 QA Bot，例如 Kimi API 小助手

　　針對固定的文檔集合的頻繁查詢，例如上市公司信息披露問答工具

　　對靜態代碼庫或知識庫的周期性分析，例如各類 Copilot Agent

　　瞬時流量巨大的爆款 AI 應用，例如哄哄模擬器，LLM Riddles

　　交互規則復雜的 Agent 類應用等

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

　　計費說明

　　上下文緩存收費模式主要分為以下三個部分：

　　Cache 創建費用

　　調用 Cache 創建接口，成功創建 Cache 后，按照 Cache 中 Tokens 按實際量計費。24 元 / M token

　　Cache 存儲費用

　　Cache 存活時間內，按分鐘收取 Cache 存儲費用。10 元 / M token / 分鐘

　　Cache 調用費用

　　Cache 調用增量 token 的收費：按模型原價收費

　　Cache 調用次數收費：Cache 存活時間內，用戶通過 chat 接口請求已創建成功的 Cache，若 chat message 內容與存活中的 Cache 匹配成功，將按調用次數收取 Cache 調用費用。0.02 元 / 次

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

? ? ?公測時間和資格說明

　　公測時間：功能上線后，公測 3 個月，公測期價格可能隨時調整。

　　公測資格：公測期間 Context Caching 功能優先開放給 Tier5 等級用戶，其他用戶范圍放開時間待定。

　　以上是系統之家提供的最新資訊，感謝您的閱讀，更多精彩內容請關注系統之家官網。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/39130.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/39130.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/39130.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

基于java+springboot+vue實現的旅游管理系統（文末源碼+Lw）227

基于java+springboot+vue實現的旅游管理系統（文末源碼+Lw）227

摘要現代經濟快節奏發展以及不斷完善升級的信息化技術，讓傳統數據信息的管理升級為軟件存儲，歸納，集中處理數據信息的管理方式。本旅游管理系統就是在這樣的大環境下誕生，其可以幫助使用者在短時間內處理完畢龐大的數據信息&a…

閱讀更多...

HMM，EM算法（Expectation-Maximization Algorithm） VAE）以及KL散度

HMM，EM算法（Expectation-Maximization Algorithm） VAE）以及KL散度

HMM，EM算法（Expectation-Maximization Algorithm） VAE）以及KL散度最大化對數似然（或稱為最大化對數似然函數）是在統計學中用來估計模型參數的一種常用方法。其基本思想是找到一組參數值，使得在…

閱讀更多...

本地文本向量模型的部署提供兼容openai的接口

本地文本向量模型的部署提供兼容openai的接口

前言之前部署了fastgpt官方文檔的一個，提供的一個m3e-large的向量模型打包的docker鏡像，雖然使用起來整體效果還可以，但是有些文本向量相似度匹配的結果還是不太滿意的，目前，網絡上層出不窮的帶推理文本向量，想體驗一下，于是我基于modelscope庫封裝了一個兼容open ai的…

閱讀更多...

探索視覺世界：深入了解目標檢測算法的奧秘

探索視覺世界：深入了解目標檢測算法的奧秘

目標檢測算法一、介紹目標檢測算法的背景和意義1.1 目標檢測的定義和應用場景1.2 目標檢測算法的發展歷程二、目標檢測算法分類2.1 傳統目標檢測算法2.1.1 基于分類器的目標檢測算法2.1.2 基于模板匹配的目標檢測算法 2.2 深度學習目標檢測算法2.2.1 兩階段目標檢測算法2.2.2…

閱讀更多...

Android Gradle 開發與應用 (四): 多模塊構建與組件化，提升Android開發效率的途徑

Android Gradle 開發與應用 (四): 多模塊構建與組件化，提升Android開發效率的途徑

目錄 1. 多模塊構建的基本概念 2. 組件化的基本概念 3. 多模塊構建與組件化的優勢 4. 多模塊構建的實現方法 5. 組件化的實現方法 6. 多模塊構建與組件化的實踐 7. 案例分析 8. 未來展望結語隨著移動應用的功能日益復雜，單一模塊開發方式的弊端愈加明顯。…

閱讀更多...

全國范圍內嚴格推行雙休制才是勞動力使用方面面向未來和可持續發展的

全國范圍內嚴格推行雙休制才是勞動力使用方面面向未來和可持續發展的

我有以下理由： 合法依規每天不超8小時、每周不超過40小時，這是國務院令第146號，很多年前就明確要求的，在國有企業和事業單位也早就推行了很多年的；對確有實際需要的崗位，也有經過行政審批的“不定時工作…

閱讀更多...

2024年廣東省食品安全管理員考試精選練習題庫

2024年廣東省食品安全管理員考試精選練習題庫

76.已具有主體資格的企業申請食品流通可，該企業的（）為可申請人。 A.投資者 B.經營負責人 C.本身答案：C 77.食用亞硝酸鹽的銷售只面向（）。 A.食品生產加工行業 B.餐飲業 C.食品流通單位答案&…

閱讀更多...

微軟賬戶和本地賬戶有什么區別？如何切換登錄賬戶？

微軟賬戶和本地賬戶有什么區別？如何切換登錄賬戶？

Windows 操作系統是目前世界上比較流行的操作系統之一，在使用 Windows 系統的時候都需要我們進行登錄，其中我們可以使用微軟賬戶或者本地賬戶進行登錄，那本地賬戶和微軟賬戶有什么區別？下面就帶大家了解一下微軟賬戶和本地賬戶。 …

閱讀更多...

基于機器學習的零售商品銷售數據預測系統

基于機器學習的零售商品銷售數據預測系統

1 項目介紹 1.1 研究目的和意義在電子商務日益繁榮的今天，精準預測商品銷售數據成為商家提升運營效率、優化庫存管理以及制定營銷策略的關鍵。為此，開發了一個基于深度學習的商品銷售數據預測系統，該系統利用Python編程語言與Django框架&a…

閱讀更多...

惠海 H6900B 2.7V3.7V4.2V5V9V升12V24V48VLED升壓恒流芯片IC

惠海 H6900B 2.7V3.7V4.2V5V9V升12V24V48VLED升壓恒流芯片IC

惠海H6900B LED升壓恒流芯片IC是一款功能豐富的LED驅動解決方案，為高亮度LED燈串設計。以下是針對該產品的進一步分析和解釋： 產品特點高效率：高達95%以上的效率意味著在驅動LED時，只有很少的能量轉化為熱量，從而提…

閱讀更多...

Docker常用指令。（工作中用到的）

Docker常用指令。（工作中用到的）

文章目錄 Docker常用指令重啟docker容器查看運行結果查看文件并跳轉到指定行數查看容器日志創建容器交互式的方式創建容器后臺式創建容器退出容器 Docker常用指令 docker ps # 列出所有運行的容器 docker ps -a # 列出所有的容器 docker exec -it containerId或containerName …

閱讀更多...

SolidityFoundry 安全審計測試 memory濫用

SolidityFoundry 安全審計測試 memory濫用

名稱： memory濫用 https://github.com/XuHugo/solidityproject/tree/master/vulnerable-defi 描述： 在合約函數中濫用storage和memory。 memory是一個關鍵字，用于臨時存儲執行合約所需的數據。它保存函數的參數數據，并在執行后…

閱讀更多...

xcrun: error: unable to find utility “simctl“, not a developer tool or in PATH

xcrun: error: unable to find utility “simctl“, not a developer tool or in PATH

目錄前言一、問題詳情二、解決方案 1.確認Xcode已安裝 2.安裝Xcode命令行工具 3.指定正確的開發者目錄 4. 確認命令行工具路徑 5. 更新PATH環境變量前言今天使用cocoapods更新私有庫的時候，遇到了"xcrun: error: unable to find utility &…

閱讀更多...

hadoop集群部署【二】YARN MapReduce 的部署

hadoop集群部署【二】YARN MapReduce 的部署

提前注意：請注意路徑是否和我的相同，放置的位置不同，請修改標紅處 HDFS部署 HDFS介紹及部署http://t.csdnimg.cn/Q3H3Y 部署說明 Hadoop HDFS分布式文件系統，我們會啟動： NameNode進程作為管理節點 DataNode進程…

閱讀更多...

歡太主題商店官方資源提取與應用第三方資源方法一覽

歡太主題商店官方資源提取與應用第三方資源方法一覽

前言疊甲：支持正版，尊重他人勞動成果，反對盜版提取，不要傳播提取版，我本人也在支持正版，但是最近懶得用主題，用一段時間的默認吧，如有主題開發者不滿，請聯系刪除 &#x…

閱讀更多...

JAVA 判斷一系列區間值有沒有重疊

JAVA 判斷一系列區間值有沒有重疊

判斷一系列區間值比喻 0-20 10-8 21-100 ...等等這些區間有沒有重疊的方法： /*** Author Minco* Date 15:44 2024-07-01* Description 區間范圍*//***/ public class Interval implements Comparable<Interval> {double start;double end;public Interval(…

閱讀更多...

機器人入門路線及參考資料（機器人操作方向）

機器人入門路線及參考資料（機器人操作方向）

機器人（操作方向）入門路線及參考資料前言1 數理基礎和編程2 機器人學理論3 計算機視覺4 機器人實操5 專攻方向總結Reference: 前言隨著機器人和具身智能時代的到來，機器人越來越受到大家的重視，本文就介紹了機器人（…

閱讀更多...

基于SpringBoot民宿管理系統設計和實現(源碼+LW+調試文檔+講解等)

基于SpringBoot民宿管理系統設計和實現(源碼+LW+調試文檔+講解等)

💗博主介紹：?全網粉絲10W,CSDN作者、博客專家、全棧領域優質創作者，博客之星、平臺優質作者、專注于Java、小程序技術領域和畢業項目實戰?💗 🌟文末獲取源碼數據庫🌟 感興趣的可以先收藏起來，…

閱讀更多...

13-4 GPT-5：博士級AI，人工智能的新時代

13-4 GPT-5：博士級AI，人工智能的新時代

圖片來源：AI Disruptive 人工智能世界正在迅速發展，新的創新和突破層出不窮。在本文中，我們將深入探討最新的進展，從即將推出的 GPT-5 模型到 Apple 和 Meta 之間可能的合作。 GPT-5：博士級別的人工智能雖然尚未正…

閱讀更多...

為何交易價格可能超出預期？

為何交易價格可能超出預期？

當你嘗試執行訂單時，如果收到“報價超出”的提示，這通常意味著交易無法按你的預期價格成交。對于某些交易者來說，這可能會帶來一些困擾，但在外匯等流動性極高的市場中，這種情況是相當常見的。外匯市場之所以吸引眾多…

閱讀更多...

最新文章