ollama更新升級及警告解決

1.?概述

在大模型業務處理中,需要用到gemma3?和?qwen2.5-VL,當前服務器的ollama版本 0.3.11,無法滿足要求,需要更新升級。

2.?實施過程

參考官網升級要求:

curl -fsSL https://ollama.com/install.sh | sh

不知道啥原因,訪問一直超時,無法下載。沒有辦法只好在本地通過?VPN下載,然后上傳到服務器。

1)查看本地當前版本,并停止,確保端口不被占用。

# 當前系統中ollama路徑
which ollama
# 輸出
/usr/local/bin/ollama# 先停止當前版本
sudo systemctl stop ollama

2)找到當前最新版本 0.6.4,到版本release頁面(Releases · ollama/ollama),找到合適的平臺包 (ollama-linux-amd64.tgz),然后上傳到服務器。

3)解壓

在解壓之前,先檢查壓縮包中的文件內容,以確保不會覆蓋重要文件:

tar -tzf ollama-linux-amd64.tgz
# 可以看到輸出:
bin/ollama
lib/ollama/cuda_v11/
lib/ollama/cuda_v11/libggml-cuda.so
lib/ollama/cuda_v11/libcublas.so.11
lib/ollama/cuda_v11/libcublas.so.11.5.1.109
lib/ollama/cuda_v11/libcublasLt.so.11.5.1.109
lib/ollama/cuda_v11/libcudart.so.11.3.109
lib/ollama/cuda_v11/libcublasLt.so.11
lib/ollama/cuda_v11/libcudart.so.11.0
lib/ollama/cuda_v12/
lib/ollama/cuda_v12/libggml-cuda.so
lib/ollama/cuda_v12/libcudart.so.12
lib/ollama/cuda_v12/libcudart.so.12.8.90
lib/ollama/cuda_v12/libcublasLt.so.12
lib/ollama/cuda_v12/libcublas.so.12.8.4.1
lib/ollama/cuda_v12/libcublas.so.12
lib/ollama/cuda_v12/libcublasLt.so.12.8.4.1
lib/ollama/libggml-base.so
lib/ollama/libggml-cpu-alderlake.so
lib/ollama/libggml-cpu-haswell.so
lib/ollama/libggml-cpu-icelake.so
lib/ollama/libggml-cpu-sandybridge.so
lib/ollama/libggml-cpu-skylakex.so

解壓到 /usr 目錄,根據上述可以看到,會更新 /usr 目錄下的 bin 和 lib 目錄。

sudo tar -C /usr -xzf ollama-linux-amd64.tgz

這樣相關新版本ollama都安裝完畢。

4)更新?service

更新 /etc/systemd/system/ollama.service,主要是 ExecStart 路徑:

[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=$PATH"
Environment="CUDA_VISIBLE_DEVICES=0,1,2,3"
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="OLLAMA_NUM_PARALLEL=4"
Environment="OLLAMA_MAX_LOADED_MODELS=2"
Environment="OLLAMA_KEEP_ALIVE=-1"[Install]
WantedBy=default.target

然后執行更新:

sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama

查看版本:

ollama -v
# 輸出
ollama version is 0.6.4
Warning: client version is 0.3.11

5)解決警告

這個警告的原因,應該是上一個版本的信息殘留,直接去 /usr/local/bin/ 路徑下,刪除 ollama,然后建立軟鏈接:

ln -s /usr/bin/ollama ollama

再次執行 ollama -v:

ollama version is 0.6.4
# 正常

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/75771.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/75771.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/75771.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ubuntu 配置固定ip

在裝服務器系統的時候,DHCP自動獲取ip時,路由可能會重新分配ip,為避免產生影響,可以關閉DHCP將主機設置為靜態ip。 系統環境 Ubuntu 22.04-Desktop 配置方式 一、如果是裝的Ubuntu圖形化(就是可以用鼠標操作點擊應用…

套接字編程函數recv和send ,以及設置reuseaddress

recv就是去套接字讀緩沖區讀數據 阻塞模式下:讀緩沖區沒數據那就阻塞等待,若等待被打斷返回-1設置errno為EINTR 非阻塞模式下:讀緩沖區沒數據那就返回-1,設置errno為EAGAIN或EWOULDBLOCK。 若連接斷開返回0,讀取成功…

《C++后端開發最全面試題-從入門到Offer》目錄

當今科技行業對C++開發者的需求持續高漲,從金融科技到游戲開發,從嵌入式系統到高性能計算,C++憑借其卓越的性能和靈活性始終占據著關鍵地位。然而,成為一名優秀的C++工程師并非易事,不僅需要扎實的語言基礎,還要掌握現代C++特性、設計模式、性能優化技巧以及各種工業級開…

設計模式簡述(十)責任鏈模式

責任鏈模式 描述基本使用使用 描述 如果一個請求要經過多個類似或相關處理器的處理。 可以考慮將這些處理器添加到一個鏈上,讓請求逐個經過這些處理器進行處理。 通常,在一個業務場景下會對整個責任鏈進行初始化,確定這個鏈上有哪些Handler…

初識數據結構——Java集合框架解析:List與ArrayList的完美結合

📚 Java集合框架解析:List與ArrayList的完美結合 🌟 前言:為什么我們需要List和ArrayList? 在日常開發中,我們經常需要處理一組數據。想象一下,如果你要管理一個班級的學生名單,或…

ReFormX:現代化的 React 表單解決方案 - 深度解析與最佳實踐

ReFormX文檔 表單開發一直是前端工作中最繁瑣卻又最常見的任務之一。從簡單的登錄表單到復雜的多步驟配置頁面,開發者往往需要編寫大量重復代碼,處理繁瑣的狀態管理、數據驗證和聯動邏輯。ReFormX 應運而生,它不僅是一個表單組件庫&#xff…

WinForm真入門(9)——RichTextBox控件詳解

WinForm中RichTextBox控件詳解:從基礎到高級應用 上一文中筆者重點介紹了TextBox控件的詳細用法,忘記的 請點擊WinForm真入門(8)——TextBox控件詳解,那么本文中的RichTextBox與TextBox有什么區別嗎,光看名字的話,多了…

Draw.io 全面解析與競品分析:圖表繪制工具的深度對比

目錄 一、Draw.io 全面介紹 1. 產品概述 2. 核心功能特點 3. 用戶體驗 4. 商業模式 二、市場競品分析 1. 主要競品概覽 2. 深度功能對比 3. 價格策略對比 4. 技術架構對比 三、用戶場景與選擇建議 1. 不同場景下的工具推薦 2. 未來發展趨勢 四、結論 diagrams.net…

kafka分區策略詳解

Kafka 分區策略詳解 Kafka 的分區策略決定了消息在生產者端如何分配到不同分區,以及在消費者端如何動態分配分區以實現負載均衡。以下是 Kafka 核心分區策略及其適用場景的詳細解析: 1、生產者分區策略 生產者負責將消息發送到 Topic 的特定分區&#…

C++ STL 詳解 ——list 的深度解析與實踐指南

在 C 的標準模板庫(STL)中,list作為一種重要的序列式容器,以其獨特的雙向鏈表結構和豐富的操作功能,在許多編程場景下發揮著關鍵作用。深入理解list的特性與使用方法,能幫助開發者編寫出更高效、靈活的代碼…

GenerationMixin概述

類 類名簡單說明GenerateDecoderOnlyOutput繼承自 ModelOutput,適用于非束搜索方法的解碼器-only模型輸出類。GenerateEncoderDecoderOutput繼承自 ModelOutput,適用于非束搜索方法的編碼器-解碼器模型輸出類。GenerateBeamDecoderOnlyOutput繼承自 Mod…

【備賽】藍橋杯嵌入式實現led閃爍

原理 由于藍橋杯的板子帶有鎖存器,并且與lcd屏幕有沖突,所以這個就成了考點。 主要就是用定時器來實現,同時也要兼顧lcd的沖突。 一、處理LCD函數 首先來解決與lcd屏幕沖突的問題,把我們所有用到的lcd函數改裝一下。 以下是基…

C++ 并發性能優化實戰:提升多線程應用的效率與穩定性

🧑 博主簡介:CSDN博客專家、CSDN平臺優質創作者,獲得2024年博客之星榮譽證書,高級開發工程師,數學專業,擁有高級工程師證書;擅長C/C、C#等開發語言,熟悉Java常用開發技術&#xff0c…

Python----計算機視覺處理(Opencv:道路檢測之車道線擬合)

完整版: Python----計算機視覺處理(Opencv:道路檢測完整版:透視變換,提取車道線,車道線擬合,車道線顯示) 一、獲取左右車道線的原始位置 導入模塊 import cv2 import numpy as np from matplot…

優選算法的妙思之流:分治——歸并專題

專欄:算法的魔法世界 個人主頁:手握風云 目錄 一、歸并排序 二、例題講解 2.1. 排序數組 2.2. 交易逆序對的總數 2.3. 計算右側小于當前元素的個數 2.4. 翻轉對 一、歸并排序 歸并排序也是采用了分治的思想,將數組劃分為多個長度為1的子…

C語言查漏補缺:基礎篇

1.原理 C語言是一門編譯型計算機語言,要編寫C代碼,C源代碼文本文件本身無法直接執行,必須通過編譯器翻譯和鏈接器的鏈接,生成二進制的可執行文件,然后才能執行。這里的二進制的可執行文件就是我們最終要形成的可執行程…

TPS入門DAY02 服務器篇

1.創建空白插件 2.導入在線子系統以及在線steam子系統庫 MultiplayerSessions.uplugin MultiplayerSessions.Build.cs 3.創建游戲實例以及初始化會話創建流程 創建會話需要的函數,委托,委托綁定的回調,在線子系統接口綁定某一個委托的控制其…

產品經理課程

原型工具 一、土耳其機器人 這個說法來源于 1770 年出現的一個騙局,一個叫沃爾夫岡馮肯佩倫(Wolfgang von Kempelen)的人為了取悅奧地利女皇瑪麗婭特蕾莎(Maria Theresia),“制造”了一個會下國際象棋的機…

nginx中的limit_req 和 limit_conn

在 Nginx 中,limit_req 和 limit_conn 是兩個用于限制客戶端請求的指令,它們分別用于限制請求速率和并發連接數。 limit_req limit_req 用于限制請求速率,防止客戶端發送過多請求影響服務器性能。它通過 limit_req_zone 指令定義一個共享內存…

基于winform的串口調試助手

目錄 一、串口助手界面設計 1.1 串口配置 1.2 接收配置 1.3 發送配置 1.4 接收窗口和發送窗口 1.5 狀態顯示窗口 1.6 串口通訊控件 二、程序編寫 2.1 端口號自動識別并顯示在端口號下拉框 功能說明: 2.2 波特率下拉框顯示 2.3 數據位下拉框顯示 2.4 校…