ollama將模型永遠加載在顯存里

ollama將模型永遠加載在顯存里

web/2025/9/7 20:03:30/文章來源:https://blog.csdn.net/weixin_43817712/article/details/140155525

問題解析

我們在使用ollma部署大語言模型的時候,如果部署的模型尺寸較大,往往在第一次加載的時候需要花費大量的時間加載模型;等加載完成后,如果長時間不調用模型,我們會發現模型已經被釋放掉了,又要重新加載,導致體驗感極差.

這是為什么呢?因為在沒被調用時,ollama默認在顯存中駐留5min,然后就會自動釋放,如果我們兩次調用的間隔大于5min的話,那模型已經被釋放了,又要重新加載;

不過ollama預留了keep_alive參數可以控制模型駐留的時間:
該參數可以設置為:

持續時間字符串(如10M’, ‘24H’);
以秒為單位的數字(如 3600);
-1表示永遠駐留在顯存中;
0表示接受一次響應后立即清除模型;

使用方法

方法如下:
如預加載模型,并永遠駐留在顯存

curl http://localhost:11434/api/generate -d '{"model":"llama2","keep_alive”: -1}

具體keep_alive可以根據實際情況自由設置;

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/38856.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/38856.shtml
英文地址，請注明出處：http://en.pswp.cn/web/38856.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Steam夏促怎么注冊 Steam夏促賬號注冊教程

Steam夏促怎么注冊 Steam夏促賬號注冊教程

隨著夏日的炙熱漸漸充斥著每一個角落，Steam平臺也趕來添熱鬧，推出了一系列讓人眼前一亮的夏季促銷活動。如果你也是游戲愛好者，我們肯定不能錯過這次的steam夏促。正直本次夏日促銷有著很多的游戲迎來史低和新史低，有各種各樣的游…

閱讀更多...

20240703在飛凌OK3588-C開發板上刷Rockchip原廠的Buildroot20220811

20240703在飛凌OK3588-C開發板上刷Rockchip原廠的Buildroot20220811

20240703在飛凌OK3588-C開發板上刷Rockchip原廠的Buildroot20220811 2024/7/3 18:25 詳細的刷機LOG： [BEGIN] 2024/7/3 18:18:49 rootRK3588:/# DDR Version V1.07 20220412 LPDDR4X, 2112MHz channel[0] BW16 Col10 Bk8 CS0 Row16 CS1 Row16 CS2 Die BW16 Size204…

閱讀更多...

TP8/6 更改后臺入口地址admin改為myadmin 隱藏真實后臺網址

TP8/6 更改后臺入口地址admin改為myadmin 隱藏真實后臺網址

原來www.xxx.com/admin 改后www.xxx.com/myadmin config/app.php // 應用映射（自動多應用模式有效）app_map > [admintest>admin],

閱讀更多...

JavaScript 實用技巧(二)

JavaScript 實用技巧(二)

JavaScript 實用技巧：提升你的編程效率 JavaScript 是一種廣泛使用和極具表現力的編程語言。為了幫助你更高效地編寫代碼，本文將介紹一些實用的 JavaScript 技巧。掌握這些技巧將有助于提高你的編程速度和代碼質量。 1. 交換變量的值不需要使用臨時變…

閱讀更多...

為何同一PDF文檔用不同軟件打印效果不同？

為何同一PDF文檔用不同軟件打印效果不同？

通過掃描儀生成的同一PDF文檔，同樣的設置，為什么別的電腦打出來是白底我的打出來有灰色格子背景？這種情況通常是由于PDF閱讀軟件的不同造成的差異。 ### 可能的原因和解決方法： 1. **PDF閱讀軟件的不同**： - **解決方…

閱讀更多...

Vue3輕松創建交互式儀表盤

Vue3輕松創建交互式儀表盤

本文由ScriptEcho平臺提供技術支持項目地址：傳送門基于 Plotly.js 的 Vue 儀表盤組件應用場景介紹儀表盤是一種交互式可視化工具，用于監控和分析關鍵指標。它廣泛應用于各種行業，例如金融、醫療保健和制造業。代碼基本功能介紹本…

閱讀更多...

FFmpeg 命令行音視頻格式轉換

FFmpeg 命令行音視頻格式轉換

📚：FFmpeg 提供了豐富的命令行選項和功能，可以用來處理音視頻文件、流媒體等，掌握命令行的使用，可以有效提高工作效率。目錄一、視頻轉換和格式轉換 🔵 將視頻文件轉換為另一種格式 🔵 指定…

閱讀更多...

12個驚艷的可視化大屏：解鎖數據之美，洞見未來趨勢

12個驚艷的可視化大屏：解鎖數據之美，洞見未來趨勢

在數字化轉型的浪潮中，可視化大屏以其獨特的魅力和強大的功能，成為了企業展示數據、洞察趨勢的重要窗口。我們將一同探索12個驚艷的可視化大屏案例，感受數據之美，洞見未來趨勢。可視化大屏，作為數據可視化的高級形態…

閱讀更多...

vue3繪制廣東深圳地圖使用echarts

vue3繪制廣東深圳地圖使用echarts

<template><el-card><template #header> 地級市分類圖 </template><div :id"id" :class"className" :style"{ height, width }"></div></el-card> </template><script …

閱讀更多...

徹底學會Gradle插件版本和Gradle版本及對應關系

徹底學會Gradle插件版本和Gradle版本及對應關系

看完這篇，保你徹底學會Gradle插件版本和Gradle版本及對應關系，超詳細超全的對應關系表需要知道Gradle插件版本和Gradle版本的對應關系，其實就是需要知道Gradle插件版本對應所需的gradle最低版本，詳細對應關系如下表格&#xff0…

閱讀更多...

Lua、AB包熱更新總結

Lua、AB包熱更新總結

1.AB包熱更新 （1）AB包是一種特定的壓縮文件，可以放模型貼圖音效等等 （2）Resources目錄下打包時只讀無法修改；而AB包存儲的位置是自定義的，能夠動態更新，同時可以決定資源包初始的大…

閱讀更多...

0703_ARM7

0703_ARM7

練習： 封裝exti，cic初始化函數 //EXTI初始化 void hal_key_exti_init(int id,int exticr,int mode){//獲取偏移地址int address_offset (id%4)*8;//獲取寄存器編號int re_ser (id/4)1;//printf("address_offset%d,re_ser%d\n",address_o…

閱讀更多...

Excel中按列的首行字母順序，重新排列(VBA腳本)

Excel中按列的首行字母順序，重新排列(VBA腳本)

排序前要求對4列數據按照第一行abcd的順序排列 VB腳本如下： 要使用這個腳本，請按照以下步驟操作： 打開Excel，然后按下 Alt F11 打開VBA編輯器。在VBA編輯器中，選擇“插入” > “模塊”，在打開的模塊…

閱讀更多...

【Python機器學習】算法鏈與管道——構建管道

【Python機器學習】算法鏈與管道——構建管道

目錄 1、首先，我們構建一個由步驟列表組成的管道對象。 2、向任何其他scikit-learn估計器一樣來擬合這個管道 3、調用pipe.score 我們來看下如何使用Pipeline類來表示在使用MinMaxScaler縮放數據后，再訓練一個SVM的工作流程（暫時不用網格搜…

閱讀更多...

常用的限流工具Guava RateLimiter 或Redisson RRateLimiter

常用的限流工具Guava RateLimiter 或Redisson RRateLimiter

在分布式系統和高并發場景中，限流是一個非常常見且重要的需求。以下是一些常用的限流工具和庫，包括它們的特點和使用場景： 1. Guava RateLimiter Google 的 Guava 庫中的 RateLimiter 是一個簡單且高效的限流工具，適用于單節點應…

閱讀更多...

MySQL數據庫設計作業 ——《網上書店系統》數據庫設計實驗報告

MySQL數據庫設計作業 ——《網上書店系統》數據庫設計實驗報告

數據庫設計作業——《網上書店系統》數據庫設計一、功能需求普通用戶：可以進行最基礎的登陸操作，可瀏覽圖書、按類別查詢圖書、查看圖書的詳細信息，還可以注冊成為會員。會員：需要填寫詳細信息（真實姓名、性別、手…

閱讀更多...

什么是yum源？如何對其進行配置？

什么是yum源？如何對其進行配置？

哈嘍，大家好呀！這里是碼農后端。今天來聊一聊Linux下的yum源及其配置相關的內容。簡單來說，yum源就相當于一個管理軟件的工具，可以想象成一個很大的倉庫，里面存放著各種我們所需要的軟件包及其依賴。一、Linux下軟件包…

閱讀更多...

VRPTW（MATLAB）：北極海鸚優化（APO）算法求解帶時間窗的車輛路徑問題VRPTW（提供MATLAB代碼）

VRPTW（MATLAB）：北極海鸚優化（APO）算法求解帶時間窗的車輛路徑問題VRPTW（提供MATLAB代碼）

詳細介紹 VRPTW（MATLAB）：北極海鸚優化（Arctic puffin optimization，APO）算法求解帶時間窗的車輛路徑問題VRPTW（提供MATLAB代碼）-CSDN博客 ********************************求解結果…

閱讀更多...

電源管理芯片PMIC的安全策略

電源管理芯片PMIC的安全策略

1.概述 PMIC作為系統的電源管理模塊，其輸入電壓一般會比較高，為保證芯片自身的安全，PMIC芯片會有獨立的安全域，和功能域完全隔離，擁有獨立的電壓和電流輸入，獨立的晶振模塊，內部運行監控狀態機…

閱讀更多...

【代碼隨想錄_Day23】122. 買賣股票的最佳時機 II 55. 跳躍游戲 45.跳躍游戲II 1005.K次取反后最大化的數組和

【代碼隨想錄_Day23】122. 買賣股票的最佳時機 II 55. 跳躍游戲 45.跳躍游戲II 1005.K次取反后最大化的數組和

Day23 OK，今日份的打卡！第二十三天以下是今日份的總結買賣股票的最佳時機 II跳躍游戲跳躍游戲IIK次取反后最大化的數組和以下是今日份的總結 122 買賣股票的最佳時機 II 55 跳躍游戲 45 跳躍游戲II 1005 K次取反后最大化的數組和今天的題目難度不低…

閱讀更多...

最新文章