開發板部署|RK3588部署DeepSeek-1.5B

前言

??在 RK3588 上部署大模型可以顯著提升計算效率、節能、加速推理過程,并實現本地化推理,適合各種邊緣計算應用,如智能設備、自動駕駛、工業機器人、健康監測等領域。此外,RK3588 配備了強大的 NPU(神經網絡處理單元),可以加速深度學習推理過程。通過在 RK3588 上部署大模型,NPU 能夠顯著提高模型推理速度,減少推理時間,尤其在進行實時推理時十分重要。

1.部署方式

現有我知道的部署方式有兩種,一是利用ollama去部署二是使用rknn官方代碼庫去部署,前者使用cpu,后者使用npu,先說結論兩者token速度相差不大。
廢話少說,下面分享部署過程。

1.1 利用ollama部署

這里就不多說了,因為之前寫過一篇利用ollama部署deepseek的文章,這里就不贅述,直接甩命令:

# 下載并安裝ollama
curl -fsSL https://ollama.com/install.sh | sh# 下載deepseek-1.5b
ollama pull deepseek-r1:1.5b# 運行deepseek
ollama run deepseek-r1:1.5b

運行之后可以看到,cpu的占用幾乎滿了:
!](https://i-blog.csdnimg.cn/direct/7baeb6d85731463fa30e30e6f8cb1a4f.png)

watch sudo cat /sys/kernel/debug/rknpu/load

查看一下npu的占用率,根本沒動:
在這里插入圖片描述

1.2 官方代碼庫部署

1.2.1 安裝依賴(x86_64機器)

conda create -n rkllm python=3.10
conda activate rkllm
pip install rkllm_toolkit-1.1.4-cp310-cp310-linux_x86_64.whl 

這里的rkllm_toolkit安裝包可以去這里下載:rknn-llm,如果嫌下載慢可以私信問我要。

1.2.2 下載模型及轉換模型(x86_64機器)

下載項目地址:rknn-llm

下載模型地址:
DeepSeek-R1-Distill-Qwen-1.5B

cd examples/DeepSeek-R1-Distill-Qwen-1.5B_Demo/export/
python export_rkllm.py

轉換之前記得修改你的模型路徑:
在這里插入圖片描述
轉換之后地模型后綴為rkllm。

1.2.3 編譯運行代碼(x86_64機器)(可選)

①先下載下載交叉編譯工具鏈 gcc-arm-10.2-2020.11-x86_64-aarch64-none-linux-gnu
這里多說一句,交叉編譯工具鏈的作用是是為了在x86_64平臺下編譯arrch平臺下能夠執行的文件。

②修改examples/DeepSeek-R1-Distill-Qwen-1.5B_Demo/deploy/build-linux.sh中GCC_COMPILER_PATH的路徑:
在這里插入圖片描述

③開始編譯:

cd examples/DeepSeek-R1-Distill-Qwen-1.5B_Demo/deploy/
bash build-linux.sh

如圖所示,編譯之后所需庫和可執行文件在deploy/install/demo_Linux_aarch64/目錄下:
在這里插入圖片描述

1.2.4 直接下載編譯好的代碼(x86_64機器)(可選)

如果不想自己編譯代碼,這里有編譯好的代碼:

git clone https://www.modelscope.cn/radxa/DeepSeek-R1-Distill-Qwen-1.5B_RKLLM.git

注:1.2.3和1.2.4必選其中一個

1.2.5 運行代碼(RK3588)

將轉化模型和代碼復制到rk3588后,執行以下命令:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./lib
export RKLLM_LOG_LEVEL=1
./llm_demo DeepSeek-R1-Distill-Qwen-1.5B.rkllm 10000 10000

這里可以看到,cpu的利用率下去了:
在這里插入圖片描述
每個npu的占用率大概在30%-40%之間:
在這里插入圖片描述

參考

RKLLM DeepSeek-R1
這里推薦一個網站,在Hugging Face下不下來的模型可以在這里下載!!魔搭社區

總結

??本文介紹了兩種在RK3588上部署deepseek-1.5b的方法,雖然兩種方法的token是差不多的,但是我還是推薦使用npu的方法去推理大模型,后續會繼續測試deepseek中更大參數體量的模型,測試一下rk3588的極限在哪里。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/70246.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/70246.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/70246.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

UDP與TCP

用UDP一定比用TCP快嗎? 假設我們需要在a電腦的進程發一段數據到b電腦的進程我們可以選擇使用TCP或UDP協議進行通信。 對于TCP這樣的可靠性協議每次消息發出后都能明確知道對方有沒有收到,就像打電話一樣,只要“喂喂"兩下對方就能回你個…

【ELK】【Elasticsearch】數據查詢方式

1. 簡單查詢(URI Search) 通過 URL 參數直接進行查詢,適合簡單的搜索場景。 示例: bash 復制 GET /index_name/_search?qfield_name:search_value 說明: index_name:索引名稱。 field_name&#xf…

軟件測試:定義和實質

軟件缺陷的定義: 未實現說明書要求的功能出現了說明書指明不應出現的錯誤實現了說明書未提到的功能未實現說明書沒有明確提出但應該實現的目標軟件難以理解,不易使用,運行緩慢 或者從測試員客戶會認為不好的。 軟件缺陷的原因: …

【軟考】【2025年系統分析師拿證之路】【啃書】第十一章 軟件需求工程(十二)

目錄 需求的層次需求工程的主要活動需求的記錄技術需求分析需求定義 需求的層次 業務需求用戶需求系統需求 需求工程的主要活動 需求獲取需求分析形成需求規格需求確認和驗證需求管理 需求的記錄技術 任務卡片場景說明用戶故事 需求分析 方法: 結構化分析&a…

計算機網絡原理試題六

一、單項選擇 1.(單選題,5分)IP地址中網絡號的作用有 A.指定了設備能夠進行通信的網絡 B.指定了主機所屬的網絡 C.指定了被尋址的子網中的某個節點 D.標志了網絡中的主機 答案:B 2.(單選題,5分)關于IP主機地址,下列說法正確的是 A.網段部分不可以全1也不可以全0 B.主機部分可…

路由基礎 | 路由引入實驗 | 不同路由引入方式存在的問題

注:本文為 “路由基礎 | 路由表 | 路由引入” 相關文章合輯。 未整理去重。 路由基本概念 1—— 路由表信息、路由進表以及轉發流程、最長掩碼匹配原則 靜下心來敲木魚已于 2023-11-26 14:06:22 修改 什么是路由 路由就是指導報文轉發的路徑信息,可以…

更高效實用 vscode 的常用設置

VSCode 可以說是文本編輯神器, 不止程序員使用, 普通人用其作為文本編輯工具, 更是效率翻倍. 這里分享博主對于 VSCode 的好用設置, 讓 VSCode 如虎添翼 進入設置 首先進入設置界面, 后續都在這里進行配置修改 具體設置 每項配置通過搜索關鍵字, 來快速定位配置項 自動保存…

本地部署DeepSeek

1、下載ollama 瀏覽器輸入ollama,打開ollama網站,選擇版本下載 可以使用迅雷下載 打開迅雷,復制網址 2、安裝ollama ollama下載完成之后,安裝 3、查看ollama版本 Win R,cmd ollama -v 查看ollama版本 4、下載De…

大模型驅動的業務自動化

大模型輸出token的速度太低且為統計輸出,所以目前大模型主要應用在toP(人)的相關領域;但其智能方面的優勢又是如此的強大,自然就需要嘗試如何將其應用到更加廣泛的toM(物理系統、生產系統)領域中…

Leetcode1299:將每個元素替換為右側最大元素

題目描述: 給你一個數組 arr ,請你將每個元素用它右邊最大的元素替換,如果是最后一個元素,用 -1 替換。 完成所有替換操作后,請你返回這個數組。 代碼思路: 方法 replaceElements 輸入參數:…

Java 大視界 -- 人才需求與培養:Java 大數據領域的職業發展路徑(92)

💖親愛的朋友們,熱烈歡迎來到 青云交的博客!能與諸位在此相逢,我倍感榮幸。在這飛速更迭的時代,我們都渴望一方心靈凈土,而 我的博客 正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識,也…

Weboffice在線Word權限控制:限制編輯,只讀、修訂、禁止復制等

在現代企業辦公中,文檔編輯是一項常見且重要的任務。尤其是在線辦公環境中,員工需要在網頁中打開和編輯文檔,但如何確保這些文檔只能進行預覽而無法被編輯或復制,成為許多企業面臨的一個痛點。尤其是在處理涉密文檔時,…

基于 Spring Boot 和微信小程序的倉儲管理系統設計與實現

大家好,今天要和大家聊的是一款基于 Spring Boot 和 微信小程序 的“倉儲管理系統”的設計與實現。項目源碼以及部署相關事宜請聯系我,文末附上聯系方式。 項目簡介 基于 Spring Boot 和 微信小程序 的“倉儲管理系統”主要使用者分為 員工、供應商 和…

Stable Diffusion本地化部署超詳細教程(手動+自動+整合包三種方式)

一、 Stable Diffusion簡介 2022年作為AIGC(Artificial Intelligence GeneratedContent)時代的元年,各個領域的AIGC技術都有一個迅猛的發展,給工業界、學術界、投資界甚至競賽界都注入了新的“[AI(https://so.csdn.net/so/search…

WPS的AI助手進化跟蹤(靈犀+插件)

Ver V0.0 250216: 如何給WPS安裝插件用以支持其他大模型LLM V0.1 250217: WPS的靈犀AI現在是DeepSeek R1(可能是全參數671B) 前言 WPS也有內置的AI,叫靈犀,之前應是自已的LLM模型,只能說是屬于“能用,有好過無”,所…

通俗理解-L、-rpath和-rpath-link編譯鏈接動態庫

一、參考資料 鏈接選項 rpath 的應用和原理 | BewareMyPower的博客 使用 rpath 和 rpath-link 確保 samba-util 庫正確鏈接-CSDN博客 編譯參數-Wl和rpath的理解_-wl,-rpath-CSDN博客 Using LD, the GNU linker - Options Directory Options (Using the GNU Compiler Colle…

SpringMVC環境搭建

文章目錄 1.模塊創建1.創建一個webapp的maven項目2.目錄結構 2.代碼1.HomeController.java2.home.jsp3.applicationContext.xml Spring配置文件4.spring-mvc.xml SpringMVC配置文件5.web.xml 配置中央控制器以及Spring和SpringMVC配置文件的路徑6.index.jsp 3.配置Tomcat1.配置…

window中git bash使用conda命令

window系統的終端cmd和linux不一樣,運行不了.sh文件,為了在window中模仿linux,可以使用gui bash模擬linux的終端。為了在gui bash中使用python環境,由于python環境是在anaconda中創建的,所以需要在gui bash使用conda命…

在線考試系統(代碼+數據庫+LW)

摘 要 使用舊方法對在線考試系統的信息進行系統化管理已經不再讓人們信賴了,把現在的網絡信息技術運用在在線考試系統的管理上面可以解決許多信息管理上面的難題,比如處理數據時間很長,數據存在錯誤不能及時糾正等問題。這次開發的在線考試…

c/c++藍橋杯經典編程題100道(19)漢諾塔問題

漢諾塔問題 ->返回c/c藍橋杯經典編程題100道-目錄 目錄 漢諾塔問題 一、題型解釋 二、例題問題描述 三、C語言實現 解法1:遞歸法(難度★) 解法2:迭代法(難度★★★) 四、C實現 解法1&#xff1…