消費級顯卡上ollama部署QwQ32B

ollama部署QwQ32B

  • QwQ32B硬件要求

    魔改2080ti 的 22G 顯存差不多夠用

    ollama中的是Q4_K_M量化模型

    硬件配置模型推理模型高效微調模型全量微調
    顯存占用最低配置顯存占用最低配置顯存占用最低配置
    FP_1664GRTX3090*4(94G)92GRTX3090*4(94G)350GA100*6(480G)
    Q_4_K_M23GRTX3090(24G)31GRTX3090*2(48G)

使用命令安裝 ollama

  • 官網安裝命令

    curl -fsSL https://ollama.com/install.sh | sh
    

    image-20250314145555539

  • 啟動 ollama

    ollama server
    

    后臺啟動 ollama 并將 日志寫入當前文件夾的 ollama.log 文件夾下

    nohup ollama serve > ollama.log 2>&1 &
    

使用安裝包下載 ollama

  • ollama github主頁的安裝包

    https://github.com/ollama/ollama/releases

    image-20250314220102162

    點擊下載(因網絡原因建議點擊下載)或者使用 wegt 下載對應 系統版本的 ollama 安裝包,下面使用 wget 來演示,我使用的 GPU主機是 ubuntu 的,所以使用ollama-linux-arm64.tgz,右鍵復制下載鏈接,使用 wget 下載

    wget https://github.com/ollama/ollama/releases/download/v0.6.0/ollama-linux-arm64.tgz
    
    mkdir ./ollama
    tar -zxvf ollama-linux-amd64.tgz -C ./ollama
    
    chmod +x ollama
    
  • 將 bin 目錄添加到系統環境變量

    vim ~/.bashrc
    

    添加以下

    export PATH=$PATH:/root/lanyun-tmp/ollama/bin

    保存并退出后,輸入如下命令來使環境變量生效:

    source ~/.bashrc
    
  • 更換 ollama 模型下載的存放地址

    vim ~/.bashrc
    

    添加如下

    export OLLAMA_MODELS=/root/lanyun-tmp/models

    保存并退出后,輸入如下命令來使環境變量生效:

    source ~/.bashrc
    

    測試下

    echo $OLLAMA_MODELS
    

部署 qwq32b

  • ollama 中的 qwq32b 是自己量化的,量化顯存占用大概在 22G 左右

  • 下載 qwq32b

    ollama run qwq
    

    image-20250314150622849

    等待下載完成

    image-20250314150647102

    下載完成后即進入對話

    image-20250314170717521

    可以看到大概占用了 22G顯存左右

    image-20250314174113841


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/73365.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/73365.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/73365.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

萬字長文詳解嵌入式電機軟件開發

目錄 第一章:嵌入式電機概述 1.1 電機類型:選對 “主角” 有多重要? 1.2 嵌入式系統特點:硬件的 “靈魂” 靠什么支撐? 第二章:開發環境搭建 2.1 硬件平臺選擇:給 “大腦” 找個好載體 2.1.1 ARM Cortex 系列:全能選手 2.1.2 AVR 微控制器:簡約而不簡單 2.1.3 …

python-54-使用環境變量庫python-dotenv進行應用程序配置參數的管理

文章目錄 1 python-dotenv簡介1.1 十二因素原則1.1.1 引言1.1.2 背景1.1.3 十二因素1.2 python-dotenv概述2 python-dotenv應用2.1 文件.env2.2 方式一load_dotenv()2.3 方式二dotenv_values()2.4 指定配置文件路徑3 Flask結合dotenv3.1 Flask的config3.2 結合使用4 代碼中的配…

How to introduce a new product in English?

How to introduce a new product in English? References Introducing a new product Forever: Yeah, sure. Today I am glad to announce [??na?ns] that our new App has made it through the final testing stage. The name of the new App is on-device Stable Diffus…

數字電路 | 觸發器 / 單穩態觸發器 / 雙穩態觸發器

注:本文為 “數字電路 | 觸發器” 相關文章合輯。 如有內容異常,請看原文。 未整理。 數字電路基礎 — 觸發器 Oliver-H 已于 2024-04-07 15:06:25 修改 觸發器(Flip-Flop) 也是數字電路中的一種具有記憶功能的邏輯元件。觸發…

SSM基礎專項復習5——Maven私服搭建(2)

系列文章 1、SSM基礎專項復習1——SSM項目整合-CSDN博客 2、SSM基礎專項復習2——Spring 框架(1)-CSDN博客 3、SSM基礎專項復習3——Spring框架(2)-CSDN博客 4、SSM基礎專項復習4——Maven項目管理工具(1&#xff…

【Java 基礎(人話版)】進制轉換

進制的簡單介紹 整數可以使用四種不同的進制表示方式: 二進制 (Binary):由 0 和 1 組成,滿 2 進 1,以 0b 或 0B 開頭表示。十進制 (Decimal):由 0-9 組成,滿 10 進 1,是最常用的數值表示方式。…

11.anaconda中的jupyter使用、及整合dataspell

目錄 概述jupyterjupyter notebook1.生成配置文件修改notebook保存目錄問題問題2,無法獲取token 安裝 DataSpell注意配置運行環境DataSpell 使用 概述 前置安裝如有問題: 1.Python、anaconda介紹、安裝及使用 jupyter jupyter notebook 1.生成配置文…

藍橋杯 之 回溯之充分剪枝

文章目錄 買瓜最大數字 在藍橋杯當中,對于回溯是屬于一個必考的問題,但是除了回溯的幾個基本的問題,如果通過剪枝來提前刪去無效的分支,以大大減少時間復雜度是需要我們進一步思考的問題!回溯的基本問題: 回…

【春招筆試】2025.03.13-螞蟻春招筆試題

題目總結 題目一:區間未出現的最小值之和 1??:統計全為1的子數組數量和全為0的子數組數量,利用公式計算 2??:利用數學公式 n(n+1) - 2N0 - N1 計算最終答案 難度:中等 這道題目的關鍵在于理解 mex 的概念,并發現對于只含 0 和 1 的數組,mex 值只可能是 0、1 或 2。…

iOS 模塊化架構設計:主流方案與實現詳解

隨著 iOS 工程規模的擴大,模塊化設計成為提升代碼可維護性、團隊協作效率和開發靈活性的關鍵。本文將探討為什么需要模塊化,介紹四種主流的模塊化架構方案(協議抽象、依賴注入、路由機制和事件總線),并通過代碼示例和對…

太速科技-636-基于FMC的Kintex XCKU060高性能PCIe載板

基于FMC的Kintex XCKU060高性能PCIe載板 一、板卡概述 板卡主控芯片采用Xilinx 公司的 Kintex UltraScale系列FPGA XCKU060-2FFVA1156。板載 2 組 64bit 的DDR4 SDRAM,每組容量2GB,可穩定運行在2400MT/s。支持PCIE Gen3 x8模式及一路FMC HPC接口。同…

【Spring Cloud】 核心組件全解析與 2024 【微服務框架】選型指南

《Spring Cloud 核心組件全解析與 2024 微服務框架選型指南》 第一部分:Spring Cloud 核心組件及功能速查表 組件名稱核心功能一句話總結詳細功能說明Eureka服務注冊與發現的“通訊錄”Server存儲服務節點信息,Client自動注冊和拉取列表,實現…

SAP SD學習筆記31 - 銷售BOM

上一篇講 前受金處理(預付款處理)。 SAP SD學習筆記29 - 前受金處理(預收款處理)_fplt 付款申請與sd 數據表的關聯關系-CSDN博客 本章繼續講SAP SD模塊的其他知識:銷售BOM。 銷售BOM在現場還是會用到的。 目錄 1,銷售BOM概要 2,受注BOM的…

動態路徑規劃——01背包問題講解和通過滾動數組優化

如果沒有動態路徑規劃基礎的兄弟可以出去了,這個題目有兩個問題 第一問講解: 1.定義狀態表示 剛開始我做的時候根據我的經驗定義了一個狀態表示dp[i]表示從1到i個物品中選擇的最大價值,但是這個狀態表示有一個明顯的問題,我怎么知…

Java程序的邏輯控制

目錄 1、順序結構2、分支結構2.1、if 語句2.2、switch 語句 3、循環結構3.1、while 語句3.2、break3.3、continue3.4、for 循環3.5、do while 語句 1、順序結構 順序結構比較簡單,按照代碼書寫的順序一行一行執行。如果調整代碼的書寫順序, 則執行順序也發生變化。…

【鴻蒙開發】Hi3861學習筆記- GPIO之LED

00. 目錄 文章目錄 00. 目錄01. GPIO概述02. 硬件設計03. 軟件設計04. 實驗現象05. 附錄 01. GPIO概述 GPIO(General-purpose input/output)即通用型輸入輸出。通常,GPIO控制器通過分組的方式管理所有GPIO管腳,每組GPIO有一個或多…

你的完美主義:從缺陷到超能力

所屬專欄:《邏輯辨證系列》 前情回顧: 《完美還是完成》(一):完成還是完美—完成大于完美 時間、機會、情緒成本 先完成 … 本期: 《完美還是完成》(二):你的完美主…

438.找出字符串中所有字母異位詞

題目: 給定兩個字符串 s 和 p,找到 s 中所有 p 的 異位詞 的子串,返回這些子串的起始索引。不考慮答案輸出的順序。 示例 1: 輸入: s "cbaebabacd", p "abc" 輸出: [0,6] 解釋: 起始索引等于 0 的子串是 "cba&q…

win32匯編環境,對話框程序中創建托盤示例一

;運行效果 ;win32匯編環境,對話框程序中創建托盤示例一 ;托盤,就是電腦桌面右下角那個角落里的圖標,這里展示基本的應用方法。 ;直接抄進RadAsm可編譯運行。重要部分加備注。 ;下面為asm文件 ;>>>>>>>>>>>>>>…

Ansible相關工具:ansible-doc、ansible

文章目錄 管理方式相關工具ansible-doc命令用法案例 ansibleansible主配置文件日志文件主機清單 ansible命令基本格式:選項說明:ansible的Host-pattern或關系邏輯與邏輯非正則表達式 ansible命令執行過程ansible 的執行狀態 管理方式 利用ansible實現管…