消費級顯卡上ollama部署QwQ32B

消費級顯卡上ollama部署QwQ32B

diannao/2025/9/2 18:12:52/文章來源:https://blog.csdn.net/hbkybkzw/article/details/146268503

ollama部署QwQ32B

QwQ32B硬件要求

魔改2080ti 的 22G 顯存差不多夠用

ollama中的是Q4_K_M量化模型

硬件配置	模型推理		模型高效微調		模型全量微調
	顯存占用	最低配置	顯存占用	最低配置	顯存占用	最低配置
FP_16	64G	RTX3090＊4（94G）	92G	RTX3090＊4（94G）	350G	A100＊6（480G）
Q_4_K_M	23G	RTX3090（24G）	31G	RTX3090＊2（48G）	－	－

使用命令安裝 ollama

官網安裝命令

curl -fsSL https://ollama.com/install.sh | sh

啟動 ollama
```
ollama server
```
后臺啟動 ollama 并將日志寫入當前文件夾的 ollama.log 文件夾下
```
nohup ollama serve > ollama.log 2>&1 &
```

使用安裝包下載 ollama

ollama github主頁的安裝包

https://github.com/ollama/ollama/releases

點擊下載（因網絡原因建議點擊下載）或者使用 wegt 下載對應系統版本的 ollama 安裝包，下面使用 wget 來演示，我使用的 GPU主機是 ubuntu 的，所以使用ollama-linux-arm64.tgz,右鍵復制下載鏈接，使用 wget 下載
```
wget https://github.com/ollama/ollama/releases/download/v0.6.0/ollama-linux-arm64.tgz
```
```
mkdir ./ollama
tar -zxvf ollama-linux-amd64.tgz -C ./ollama
```
```
chmod +x ollama
```
將 bin 目錄添加到系統環境變量
```
vim ~/.bashrc
```
添加以下

export PATH=$PATH:/root/lanyun-tmp/ollama/bin

保存并退出后，輸入如下命令來使環境變量生效：
```
source ~/.bashrc
```
更換 ollama 模型下載的存放地址
```
vim ~/.bashrc
```
添加如下

export OLLAMA_MODELS=/root/lanyun-tmp/models

保存并退出后，輸入如下命令來使環境變量生效：
```
source ~/.bashrc
```
測試下
```
echo $OLLAMA_MODELS
```

部署 qwq32b

ollama 中的 qwq32b 是自己量化的，量化顯存占用大概在 22G 左右
下載 qwq32b
```
ollama run qwq
```
等待下載完成

下載完成后即進入對話

可以看到大概占用了 22G顯存左右

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/73365.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/73365.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/73365.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

萬字長文詳解嵌入式電機軟件開發

萬字長文詳解嵌入式電機軟件開發

目錄第一章：嵌入式電機概述 1.1 電機類型：選對 “主角” 有多重要？ 1.2 嵌入式系統特點：硬件的 “靈魂” 靠什么支撐？第二章：開發環境搭建 2.1 硬件平臺選擇：給 “大腦” 找個好載體 2.1.1 ARM Cortex 系列：全能選手 2.1.2 AVR 微控制器：簡約而不簡單 2.1.3 …

閱讀更多...

python-54-使用環境變量庫python-dotenv進行應用程序配置參數的管理

python-54-使用環境變量庫python-dotenv進行應用程序配置參數的管理

文章目錄 1 python-dotenv簡介1.1 十二因素原則1.1.1 引言1.1.2 背景1.1.3 十二因素1.2 python-dotenv概述2 python-dotenv應用2.1 文件.env2.2 方式一load_dotenv()2.3 方式二dotenv_values()2.4 指定配置文件路徑3 Flask結合dotenv3.1 Flask的config3.2 結合使用4 代碼中的配…

閱讀更多...

How to introduce a new product in English?

How to introduce a new product in English?

How to introduce a new product in English? References Introducing a new product Forever: Yeah, sure. Today I am glad to announce [??na?ns] that our new App has made it through the final testing stage. The name of the new App is on-device Stable Diffus…

閱讀更多...

數字電路 | 觸發器 / 單穩態觸發器 / 雙穩態觸發器

數字電路 | 觸發器 / 單穩態觸發器 / 雙穩態觸發器

注：本文為 “數字電路 | 觸發器” 相關文章合輯。如有內容異常，請看原文。未整理。數字電路基礎 — 觸發器 Oliver-H 已于 2024-04-07 15:06:25 修改觸發器（Flip-Flop） 也是數字電路中的一種具有記憶功能的邏輯元件。觸發…

閱讀更多...

SSM基礎專項復習5——Maven私服搭建（2）

SSM基礎專項復習5——Maven私服搭建（2）

系列文章 1、SSM基礎專項復習1——SSM項目整合-CSDN博客 2、SSM基礎專項復習2——Spring 框架（1）-CSDN博客 3、SSM基礎專項復習3——Spring框架（2）-CSDN博客 4、SSM基礎專項復習4——Maven項目管理工具（1&#xff…

閱讀更多...

【Java 基礎（人話版）】進制轉換

【Java 基礎（人話版）】進制轉換

進制的簡單介紹整數可以使用四種不同的進制表示方式： 二進制 (Binary)：由 0 和 1 組成，滿 2 進 1，以 0b 或 0B 開頭表示。十進制 (Decimal)：由 0-9 組成，滿 10 進 1，是最常用的數值表示方式。…

閱讀更多...

11.anaconda中的jupyter使用、及整合dataspell

11.anaconda中的jupyter使用、及整合dataspell

目錄概述jupyterjupyter notebook1.生成配置文件修改notebook保存目錄問題問題2，無法獲取token 安裝 DataSpell注意配置運行環境DataSpell 使用概述前置安裝如有問題： 1.Python、anaconda介紹、安裝及使用 jupyter jupyter notebook 1.生成配置文…

閱讀更多...

藍橋杯之回溯之充分剪枝

藍橋杯之回溯之充分剪枝

文章目錄買瓜最大數字在藍橋杯當中，對于回溯是屬于一個必考的問題，但是除了回溯的幾個基本的問題，如果通過剪枝來提前刪去無效的分支，以大大減少時間復雜度是需要我們進一步思考的問題！回溯的基本問題： 回…

閱讀更多...

【春招筆試】2025.03.13-螞蟻春招筆試題

【春招筆試】2025.03.13-螞蟻春招筆試題

題目總結題目一：區間未出現的最小值之和 1??：統計全為1的子數組數量和全為0的子數組數量，利用公式計算 2??：利用數學公式 n(n+1) - 2N0 - N1 計算最終答案難度：中等這道題目的關鍵在于理解 mex 的概念，并發現對于只含 0 和 1 的數組，mex 值只可能是 0、1 或 2。…

閱讀更多...

iOS 模塊化架構設計：主流方案與實現詳解

iOS 模塊化架構設計：主流方案與實現詳解

隨著 iOS 工程規模的擴大，模塊化設計成為提升代碼可維護性、團隊協作效率和開發靈活性的關鍵。本文將探討為什么需要模塊化，介紹四種主流的模塊化架構方案（協議抽象、依賴注入、路由機制和事件總線），并通過代碼示例和對…

閱讀更多...

太速科技-636-基于FMC的Kintex XCKU060高性能PCIe載板

太速科技-636-基于FMC的Kintex XCKU060高性能PCIe載板

基于FMC的Kintex XCKU060高性能PCIe載板一、板卡概述板卡主控芯片采用Xilinx 公司的 Kintex UltraScale系列FPGA XCKU060-2FFVA1156。板載 2 組 64bit 的DDR4 SDRAM，每組容量2GB，可穩定運行在2400MT/s。支持PCIE Gen3 x8模式及一路FMC HPC接口。同…

閱讀更多...

【Spring Cloud】核心組件全解析與 2024 【微服務框架】選型指南

【Spring Cloud】核心組件全解析與 2024 【微服務框架】選型指南

《Spring Cloud 核心組件全解析與 2024 微服務框架選型指南》第一部分：Spring Cloud 核心組件及功能速查表組件名稱核心功能一句話總結詳細功能說明Eureka服務注冊與發現的“通訊錄”Server存儲服務節點信息，Client自動注冊和拉取列表，實現…

閱讀更多...

SAP SD學習筆記31 - 銷售BOM

SAP SD學習筆記31 - 銷售BOM

上一篇講前受金處理(預付款處理)。 SAP SD學習筆記29 - 前受金處理(預收款處理)_fplt 付款申請與sd 數據表的關聯關系-CSDN博客本章繼續講SAP SD模塊的其他知識：銷售BOM。銷售BOM在現場還是會用到的。目錄 1，銷售BOM概要 2，受注BOM的…

閱讀更多...

動態路徑規劃——01背包問題講解和通過滾動數組優化

動態路徑規劃——01背包問題講解和通過滾動數組優化

如果沒有動態路徑規劃基礎的兄弟可以出去了，這個題目有兩個問題第一問講解： 1.定義狀態表示剛開始我做的時候根據我的經驗定義了一個狀態表示dp[i]表示從1到i個物品中選擇的最大價值，但是這個狀態表示有一個明顯的問題，我怎么知…

閱讀更多...

Java程序的邏輯控制

Java程序的邏輯控制

目錄 1、順序結構2、分支結構2.1、if 語句2.2、switch 語句 3、循環結構3.1、while 語句3.2、break3.3、continue3.4、for 循環3.5、do while 語句 1、順序結構順序結構比較簡單，按照代碼書寫的順序一行一行執行。如果調整代碼的書寫順序, 則執行順序也發生變化。…

閱讀更多...

【鴻蒙開發】Hi3861學習筆記- GPIO之LED

【鴻蒙開發】Hi3861學習筆記- GPIO之LED

00. 目錄文章目錄 00. 目錄01. GPIO概述02. 硬件設計03. 軟件設計04. 實驗現象05. 附錄 01. GPIO概述 GPIO（General-purpose input/output）即通用型輸入輸出。通常，GPIO控制器通過分組的方式管理所有GPIO管腳，每組GPIO有一個或多…

閱讀更多...

你的完美主義：從缺陷到超能力

你的完美主義：從缺陷到超能力

所屬專欄：《邏輯辨證系列》前情回顧： 《完美還是完成》（一）：完成還是完美—完成大于完美時間、機會、情緒成本先完成 … 本期： 《完美還是完成》（二）：你的完美主…

閱讀更多...

438.找出字符串中所有字母異位詞

438.找出字符串中所有字母異位詞

題目： 給定兩個字符串 s 和 p，找到 s 中所有 p 的異位詞的子串，返回這些子串的起始索引。不考慮答案輸出的順序。示例 1: 輸入: s "cbaebabacd", p "abc" 輸出: [0,6] 解釋: 起始索引等于 0 的子串是 "cba&q…

閱讀更多...

win32匯編環境,對話框程序中創建托盤示例一

win32匯編環境,對話框程序中創建托盤示例一

;運行效果 ;win32匯編環境,對話框程序中創建托盤示例一 ;托盤，就是電腦桌面右下角那個角落里的圖標，這里展示基本的應用方法。 ;直接抄進RadAsm可編譯運行。重要部分加備注。 ;下面為asm文件 ;>>>>>>>>>>>>>>…

閱讀更多...

Ansible相關工具：ansible-doc、ansible

Ansible相關工具：ansible-doc、ansible

文章目錄管理方式相關工具ansible-doc命令用法案例 ansibleansible主配置文件日志文件主機清單 ansible命令基本格式：選項說明：ansible的Host-pattern或關系邏輯與邏輯非正則表達式 ansible命令執行過程ansible 的執行狀態管理方式利用ansible實現管…

閱讀更多...

最新文章