大模型本地部署系列(3) Ollama部署QwQ[阿里云通義千問]

大家好,我是AI研究者, 今天教大家部署 一個阿里云通義千問大模型。

QwQ大模型簡介

QwQ是由阿里云通義千問(Qwen)團隊推出的開源推理大模型,專注于提升AI在數學、編程和復雜邏輯推理方面的能力。其核心特點包括:

  1. 深度自省能力

    • 能夠主動質疑自身假設,進行多輪自我反思,優化推理過程,類似于人類的深度思考模式16。

    • 在解決“猜牌問題”等復雜邏輯推理任務時,展現出類似人類的逐步分析能力9。

  2. 對標OpenAI o1模型

    • 在MATH-500評測中達到90.6%的準確率,超越OpenAI的o1-preview和o1-mini模型17。

    • 在編程任務(LiveCodeBench)和研究生級科學推理(GPQA)測試中表現優異7。

  3. 高效架構設計

    • 采用動態推理路徑,根據問題復雜度調整計算深度,提高效率1。

    • 325億參數(QwQ-32B-Preview),在較小規模下實現高性能推理8。

  4. 開源與易用性

    • 阿里云首個開源AI推理模型,支持本地部署及二次開發,適用于科研、教育、編程輔助等場景36。

  5. 當前局限性

    • 語言切換時可能出現表達不連貫7。

    • 復雜邏輯推理時可能陷入循環思考9。

QwQ的推出標志著國產大模型在推理能力上的重要突破,尤其在數學和編程領域展現出接近研究生水平的分析能力。

部署步驟

首先需要安裝ollama,這個在我之前的文章已經講到了,這里就不在贅述。

我們進入到ollama的官網:

https://ollama.com/

找到上方的Models ,然后點擊

此時會跳轉到模型列表頁面:

點擊?qwq 鏈接進去,此時我們會看到下拉框中有各個版本的大模型,如下圖所示:

模型參數(1.5B、7B、8B等)是什么意思?

這些數字代表模型的?參數量(比如1.5B=15億,7B=70億),你可以簡單理解為模型的“腦細胞數量”:

  • 參數越多?→ 模型越聰明(能處理復雜任務,比如寫代碼、邏輯推理),但需要的計算資源也越多。
  • 參數越少?→ 模型更輕量(反應快、適合簡單任務),但對復雜問題可能表現一般。

舉個例子:

  • 1.5B 模型 ≈ 一個“高中生”水平(能聊天、寫短文)。
  • 7B 模型 ≈ “大學生”水平(能寫代碼、分析問題)。
  • 70B 模型 ≈ “教授”水平(專業級回答,但需要頂級顯卡)。

K_M , fp 是什么意思?

q4_K_M, q8_0, fp16 這些指的是模型精度。這里的 q4 指的是 4bit 量化,q8 指的是 8bit 量化,fp16 就是原版模型。

因為量化都是有損的,只要把握數字越小,模型體積越小,所以模型能力會更弱這個邏輯就行。所以 q4 就是 QwQ32b 家族中,體積最小,性能有可能是最弱的那個(不排除 8bit 量化也都差不多的效果)。

我們部署就選用 32b-q4_K_M,選用它的原因很簡單, 體積小。耗能低。
?

?點進?32b-q4_K_M , 找到右邊的復制 安裝命令:

打開cmd, 粘貼上面復制的命令, 等待下載。

等了很久,如果出現了 “unable to allocate CUDA0 buffer” , 表示你的GPU內存不足。

然后運行 “nvidia-smi”, 查看 占用GPU的進程,然后全部關掉。

然后重新運行命令, 還是不行的話,就是機器跟不上了!

如果成功了,默認是運行了模型,直接可以在cmd輸入命令對話, 如果關掉了,下次運行就要輸入 運行模型命令:

ollama run 模型名稱

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/77538.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/77538.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/77538.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

微信小程序學習實錄12:掌握大數據量軌跡展示的MySQL結構設計

獲取經緯度信息后,mysql建立數據表po_trajectory,字段包含tra_id、longitude、latitude、tra_time和openid。 為微信小程序創建的 po_trajectory 數據表,字段包含 tra_id、longitude、latitude、tra_time 和 openid,從結構設計上…

計算機系統---性能指標(3)續航與散熱

計算機電池續航的性能指標 一、電池基礎物理指標 電池容量(核心指標) 單位: 毫安時(mAh):常見于手機/平板,反映電池存儲電荷量,需結合電壓計算實際能量(如3.7V電池&…

貪心算法之最小生成樹問題

1. 貪心算法的基本思想 貪心算法在每一步都選擇局部最優的邊,希望最終得到整體最優的生成樹。常見的兩種 MST 算法為 Kruskal 算法 和 Prim 算法。這兩者均滿足貪心選擇性質和最優子結構性質,即: 貪心選擇性質:局部最優選擇&…

LeetCode hot 100—編輯距離

題目 給你兩個單詞 word1 和 word2, 請返回將 word1 轉換成 word2 所使用的最少操作數 。 你可以對一個單詞進行如下三種操作: 插入一個字符刪除一個字符替換一個字符 示例 示例 1: 輸入:word1 "horse", word2 &q…

2.3 Spark運行架構與流程

Spark運行架構與流程包括幾個核心概念:Driver負責提交應用并初始化作業,Executor在工作節點上執行任務,作業是一系列計算任務,任務是作業的基本執行單元,階段是一組并行任務。Spark支持多種運行模式,包括單…

NO.82十六屆藍橋杯備戰|動態規劃-從記憶化搜索到動態規劃|下樓梯|數字三角形(C++)

記憶化搜索 在搜索的過程中,如果搜索樹中有很多重復的結點,此時可以通過?個"備忘錄",記錄第?次搜索到的結果。當下?次搜索到這個結點時,直接在"備忘錄"??找結果。其中,搜索樹中的?個?個結點…

使用 VBA 宏創建一個選擇全部word圖片快捷指令,進行圖片格式編輯

使用 VBA 宏批量選擇圖片 ? 第一步:創建 .dotm 加載項文件 1、使用環境 office word 365,文件格式為.docx 圖片格式為.PNG 2、創建 .dotm 加載項文件 打開 Word,新建一個空白文檔。 按下 Alt F11 打開 VBA 編輯器。 點擊菜單欄&#xff…

深度學習的下一個突破:從圖像識別到情境理解

引言 過去十年,深度學習在圖像識別領域取得了驚人的突破。從2012年ImageNet大賽上的AlexNet,到后來的ResNet、EfficientNet,再到近年來Transformer架構的崛起,AI已經能在許多任務上超越人類,比如人臉識別、目標檢測、醫…

使用dyn4j做碰撞檢測

文章目錄 前言一、環境準備添加依賴基本概念 二、實現步驟1.創建世界2.添加物體3.設置碰撞監聽器4.更新世界 三、完整代碼示例四、優化補充總結 前言 dyn4j 提供了高效的碰撞檢測和物理模擬功能,適用于游戲開發、動畫制作以及其他需要物理交互的場景。通過簡單的 A…

VS Code settings.json 文件中常用的預定義變量?及其用途說明

VS Code settings.json 常用預定義變量 以下是 Visual Studio Code 配置文件中常用的預定義變量列表: 1. 工作區相關變量 變量描述示例值${workspaceFolder}當前工作區根目錄的絕對路徑C:/projects/my-project${workspaceFolderBasename}工作區文件夾名稱&#x…

elasticSearch-搜索引擎

搜索引擎的優勢 有了數據庫分頁查詢,為什么還需要搜索引擎? 搜索引擎速度上很快數據庫分頁查詢,隨著數據庫數據量增大,頁數靠后,會導致搜索速度變慢,但是搜索引擎不會搜索引擎支持分詞查詢,地…

安裝OpenJDK1.8 17 (macos M芯片)

安裝OpenJDK 1.8 下載完后,解壓,打開 環境變量的配置文件即可 vim ~/.zshrc #export JAVA_HOME/Users/xxxxx/jdk-21.jdk/Contents/Home #export JAVA_HOME/Users/xxxxx/jdk-17.jdk/Contents/Home #export JAVA_HOME/Users/xxxxx/jdk-11.jdk/Contents…

斷言與反射——以golang為例

斷言 x.(T) 檢查x的動態類型是否是T,其中x必須是接口值。 簡單使用 func main() {var x interface{}x 100value1, ok : x.(int)if ok {fmt.Println(value1)}value2, ok : x.(string)if ok {//未打印fmt.Println(value2)} }需要注意如果不接受第二個參數就是OK,這…

Java設計模式:系統性解析與核心模式

一、設計模式三大分類總覽 創建型模式(5種) 核心目標:對象創建的優化與解耦 單例模式(Singleton) 工廠模式(Factory) 抽象工廠模式(Abstract Factory) 建造者模式&#…

Elasticsearch 向量數據庫,原生支持 Google Cloud Vertex AI 平臺

作者:來自 Elastic Valerio Arvizzigno Elasticsearch 將作為第一個第三方原生語義對齊引擎,支持 Google Cloud 的 Vertex AI 平臺和 Google 的 Gemini 模型。這使得聯合用戶能夠基于企業數據構建完全可定制的生成式 AI 體驗,并借助 Elastics…

408 計算機網絡 知識點記憶(7)

前言 本文基于王道考研課程與湖科大計算機網絡課程教學內容,系統梳理核心知識記憶點和框架,既為個人復習沉淀思考,亦希望能與同行者互助共進。(PS:后續將持續迭代優化細節) 往期內容 408 計算機網絡 知識…

10-MySQL-性能優化思路

1、優化思路 當我們發現了一個慢SQL的問題的時候,需要做性能優化,一般我們是為了提高SQL查詢更快,一個查詢的流程由下圖的各環節組成,每個環節都會消耗時間,要減少消耗時候需要從各個環節都分析一遍。 2 連接配置優化 第一個環節是客戶端連接到服務端,這塊可能會出現服務…

Docker:安裝與部署 Nacos 的技術指南

1、簡述 Nacos(Dynamic Naming and Configuration Service)是阿里巴巴開源的一個動態服務發現、配置管理和服務治理的綜合解決方案,適用于微服務架構。 Nacos 主要功能: 服務發現與注冊:支持 Dubbo、Spring Cloud 等主流微服務框架的服務發現與注冊。動態配置管理:支持…

【非機動車檢測】用YOLOv8實現非機動車及駕駛人佩戴安全帽檢測

非機動車及駕駛人佩戴安全帽檢測任務的意義主要包括以下幾點: 保障行車安全:非機動車包括自行車、電動車等,佩戴安全帽能夠有效保護騎車人頭部,減少因交通事故造成的頭部傷害風險,提高行車安全系數。 符合交通法規&am…

壹起航:15年深耕互聯網營銷,助力中國工廠出海獲客

在全球化浪潮下,越來越多的中國工廠渴望拓展海外市場,但面臨品牌建立、穩定詢盤獲取及營銷成本降低等多重挑戰。壹起航憑借15年的豐富經驗,整合外貿建站、SEO優化及海外短視頻營銷,為中國工廠提供一站式出海解決方案。 一、外貿獨…