月之暗面Kimi開放平台推出上下文快取公測，大幅降低長文本模型成本

AI • 2天前 • AI • 29 views

今日，月之暗面正式對外宣布，其Kimi開放平台上線了全新的上下文快取（Context Caching）功能，並即日起開啟公測。這項創新技術旨在不增加API價格負擔的前提下，為開發者提供最高可達90%的成本降低，並顯著提升模型響應速度，標誌著人工智慧服務效率與成本控制的新突破。

根據官方介紹，上下文快取是一種先進的資料管理技術，它透過預先儲存頻繁請求的大量資料或訊息，顯著減少了對原始資料來源的重複計算與檢索需求。當使用者再次要求相同資訊時，系統能夠迅速從快取中調取，從而大幅降低處理時間和成本。對於依賴長文本模型進行高頻查詢的應用場景而言，這項技術無疑是一大利好。

Kimi開放平台指出，上下文快取功能特別適用於以下業務場景：提供大量預設內容的問答機器人（如Kimi API小助手）、針對固定文件集合的頻繁查詢工具（如上市公司資訊揭露問答系統）、靜態程式碼庫或知識庫的週期性分析應用（如各類Copilot Agent），以及瞬時流量龐大的AI爆款應用（如哄哄模擬器、LLM Riddles）等。官方數據顯示，啟用上下文快取後，首Token延遲可降低83%，為用戶帶來前所未有的高效體驗。

在計費方面，Kimi開放平台採取了靈活且透明的收費模式，包括Cache創建費用、Cache儲存費用和Cache呼叫費用三部分。具體而言，Cache創建費用按實際Tokens量計費，每百萬Tokens收費24元；Cache存儲費用則按分鐘收取，每百萬Tokens每分鐘收費10元；而Cache調用費用則分為增量Token費用和調用次數費用，前者按模型原價收費，後者則按每次調用0.02元的標準收取。

值得注意的是，此次公測活動將持續3個月，期間價格可能會根據市場回饋進行調整。此外，公測資格將優先開放給Tier5等級用戶，其他用戶的開放時間將另行通知。這項措施既體現了月之暗面對高品質使用者的重視，也為廣大開發者提供了一個提前體驗並回饋寶貴意見的機會。

隨著人工智慧技術的不斷發展，如何在確保服務品質的同時有效控製成本，成為許多開發者和企業關注的焦點。月之暗面Kimi開放平台此次推出的上下文快取功能，無疑為此難題提供了有效的解決方案，有望推動人工智慧服務的普及與應用場景的拓展。

本文取自媒體，由：AI 上傳發布，不代表kejixun.com立場。转载，请注明出处：https://news.kejixun.com/10114.html

Kimi 上下文快取月之暗面

讚！ (0)

AI投稿者

0 0

三星Galaxy Tab S10系列傳聞：僅推Plus與Ultra版本

Previous 2天前

00929配息衰退！每股領0.18元，有投資者表示驚訝和失望

Next 2天前

AI

蘋果與OpenAI達成協議：iOS 18將引進生成式AI

根據一名長期關注蘋果的資深記者透露，雙方已經就將生成式人工智慧功能引入蘋果iOS作業系統的下一個重大更新——iOS 18達成了一致。

iOS
2024 年 5 月 27 日
AI

馬斯克超級電腦計畫預計落腳孟菲斯，打造全球最大算力基地

億萬富翁伊隆馬斯克（Elon Musk）的超級電腦計畫xAI近日取得重大進展。根據Business Insider報道，大孟菲斯商會週三宣布，xAI正與田納西州孟菲斯市合作，計劃在…

AI
2024 年 6 月 6 日
AI

崑崙萬維Opera瀏覽器率先接入端側AI大模型

今日，科技巨頭崑崙萬維宣布，其備受歡迎的Opera One旗艦瀏覽器和遊戲專用瀏覽器Opera GX將正式整合端側AI大模型，此舉標誌著Opera成為全球首個接入端側AI大模型的主…

AI
2024 年 5 月 31 日
AI

GPT-4o vs GPT-4 Turbo：哪一款AI產品更勝一籌？

随着人工智能技术的飞速发展，OpenAI不断推出新的大型语言模型，以满足日益增长的需求。近期，GPT-4o和GPT-4 Turbo两款备受瞩目的AI产品相继亮相，引发了广泛关注和讨…

AI
2024 年 5 月 15 日
AI

GPT-4o vs Claude 3.5 Sonnet：兩大AI模型的速度與表現對決

隨著人工智慧技術的快速發展，OpenAI和Anthropic兩大科技巨頭紛紛推出了自家的最新AI模型－GPT-4o和Claude 3.5 Sonnet。這兩款模型在各自的領域內都取…

AI
2024 年 6 月 23 日
AI

Android 15系統重新定義「快速充電」標準：Google積極回應使用者需求

近日有報道稱，Google將在其即將發布的Android 15系統中，對「快速充電」的定義進行重要調整，這一舉措無疑是對當前快充技術發展的積極回應。

Infinix
2024 年 6 月 20 日
AI

Character.AI使用攻略：小白也能輕鬆上手

Character.AI，作為一款可客製化的AI聊天工具，近年來備受矚目。它不僅能讓你與虛擬角色進行深度對話，還能幫助你創造自己心儀的角色，與之互動。對於初次接觸Character…

AI
2024 年 6 月 23 日
AI

快手推出自研影片生成大模型“可靈”，邀測體驗正式開放

在人工智慧領域取得另一個重要突破，快手公司今日宣布其自研的影片生成大模型「可靈」正式上線，並向大眾開放邀測體驗。該模型採用與Sora相似的技術路線，並結合多項自研技術創新，旨在…

AI
2024 年 6 月 7 日
AI

OpenAI Sora打造首支自動生成MV，助力大導演圓夢

在數字創意領域的一次重大突破中，OpenAI的Sora技術成功助力知名編劇兼導演Paul Trillo實現了他十年前未能完成的MV制作夢想。近日，Trillo發布了首支完全利用Op…

AI
2024 年 5 月 5 日
AI

OpenAI調整離職條款，CEO就保密協議道歉

近日，人工智慧領域的領導企業OpenAI陷入了一場關於離職員工權益的爭議風波。據報道，OpenAI要求離職員工在保留既得股權和簽署保密及非貶低協議之間做出選擇，這引發了員工和外界…

AI
2024 年 5 月 20 日
AI

iOS18將推iPhone鏡像功能：蘋果持續創新，打通行動裝置間的壁壘

近日，蘋果公司再次成為科技界的焦點。蘋果發言人弗雷德·塞恩斯（Fred Sainz）在官方聲明中透露，蘋果計劃於下週一（6月24日）發布 iOS / iPadOS 18 Beta 2 更新。

iPhone
2024 年 6 月 24 日
AI

阿里云發布通義千問2.5大模型，能力全面升級，趕超GPT-4

昨日，在阿里云AI智領者峰會-北京站活動中，阿里云正式發布了通義千問2.5大模型，并宣稱其在多項能力上已全面趕超GPT-4，尤其在中文語境下的表現尤為突出。據阿里云官方介紹，通義…

AI
2024 年 5 月 10 日
AI

微軟Edge瀏覽器將推出即時視訊翻譯功能，支援多語言及手語翻譯

微軟在最近的Build開發者大會上展示了最新技術成果，其中Edge瀏覽器的「即時視訊翻譯」功能特別引人注目。該功能預計將為全球用戶帶來更方便的影片觀看體驗，特別是對於那些需要跨語…

Microsoft
2024 年 5 月 22 日
AI

英特爾CEO：別聽黃仁勳瞎忽悠摩爾定律依然有效

英特爾CEO帕特·基辛格今日表示，在AI時代，英特爾處理器不但不會失去動力，反而會繼續發揮重要作用。摩爾定律也依然有效。

intel
2024 年 6 月 5 日
AI

GitHub探討深度偽造技術監管：平衡創新與安全的新舉措

在人工智能（AI）技術快速發展的背景下，深度偽造（Deepfake）技術因其能夠生成逼真的圖像、音頻和視頻而備受關注。然而，這種技術的濫用也引發了嚴重的倫理和法律問題。為此，全球知…

AI
2024 年 4 月 30 日
AI

三星宣布 Galaxy AI 功能將上線 One UI 6 Watch 手錶系統，6 月開啟測試

近日消息，三星今晚宣布將把 Galaxy AI 功能引入 One UI 6 Watch 系統與下一代 Galaxy Watch 智慧手錶。

據介紹，Galaxy AI 將與三星健康結合，帶來下列全新的健康功能。

Samsung
2024 年 5 月 30 日
AI

OpenAI 成立監督委員會評估 AI 安全，並已開始訓練新的 AI 模型

近日消息，根據彭博社報道，OpenAI 成立了一個董事會委員會，用來評估其人工智慧模式的安全性。這項措施距離該公司解散內部安全團隊以及安全問題負責人離職僅數週時間。

AI
2024 年 5 月 29 日
AI

阿里雲開源大模式Qwen2-72B登頂Hugging Face新排行榜

近日，人工智慧領域傳來喜訊，阿里巴巴集團開源的通義千問（Qwen）指令微調模型Qwen2-72B在Hugging Face公佈的全新開源大語言模型排行榜上榮登榜首，成功超越Meta…

AI
4天前
AI

Google Play 商店宣布整頓生成式 AI 類 App：必須限制不當內容傳播

6 月 7 日消息，當地時間週四，谷歌針對 AI 類應用程式更新了指導方針，目標是減少「不適當的」和「被禁止的」內容。

Google
2024 年 6 月 7 日
AI

OpenAI Sora入口在哪裡？ Sora使用方法介紹

OpenAI在人工智慧領域一直走在前列，近日再次引領潮流，推出了名為Sora的文字到視訊模型。那麼OpenAI Sora入口在哪呢？以下跟大家介紹下OpenAI Sora使用方法。

AI
2024 年 6 月 3 日

月之暗面Kimi開放平台推出上下文快取公測，大幅降低長文本模型成本

相关推荐

發佈留言