昇思學習營-DeepSeek-R1-Distill-Qwen-1.5B 模型LoRA微調學習心得

昇思學習營-DeepSeek-R1-Distill-Qwen-1.5B 模型LoRA微調學習心得

news/2025/7/27 21:46:11/文章來源:https://blog.csdn.net/u014556926/article/details/149670222

LoRA微調：加入參數式微調

凍結原始網絡參數，對Attention層中QKV等添加旁支，包含兩個低維度的矩陣A和矩陣B，微調過程中僅更新A、B 矩陣

效果：訓練參數被大幅降低，資源消耗較低。

對attention的參數加入如下圖所示，使用兩個A，B矩陣來擬合原始QKV矩陣，其中A，B矩陣中的兩個參數r,lora_alpha為重要參數，一般情況下，lora_alpha為r的兩倍以上。

Mindspore中的實現代碼如下圖所示：

整體流程代碼部分：

數據導入和載入分詞模型及配置：

\

數據樣式：

數據處理邏輯部分：

訓練模型參數及配置載入：

訓練參數及配置：

香橙派板子上運行模型優化策略：

香橙派AIpro的host側和device側共享，所以在host側的內存占用（如python的多進程，模型加載等）也會影響到顯存。

優化策略：

1. 在加載模型時，直接加載fp16的權重，而非加載fp32權重再轉成fp16。

2.如何限制拉起的python進程數，從而控制額外的內存占用，減少對顯存的影響

3.在開啟新的終端時，手動限制進程最大內存占用，開了swap然后再限制內存就可以空出來給NPU用。

學習心得：

了解lora模型訓練基礎原理
對mindspore上進行模型微調的代碼進行分析和確認，方便后續代碼的升級和維護
對香橙派板子上進行微調的具體流程，包含數據預處理、模型參數及配置加載、訓練參數和保存等。
對香橙派板子上運行的模型優化策略有一定了解，例如權重加載、限制進程數、限制內存等。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/916368.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/916368.shtml
英文地址，請注明出處：http://en.pswp.cn/news/916368.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

彩色轉灰度的核心邏輯：三種經典方法及原理對比

彩色轉灰度的核心邏輯：三種經典方法及原理對比

灰度實驗將彩色圖像轉換為灰度圖像的過程稱為灰度化，這種做法在圖像處理和計算機視覺領域非常常見。灰度圖與彩色圖最大的不同就是：彩色圖是由R、G、B三個通道組成，而灰度圖只有一個通道，也稱為單通道圖像，所以彩色圖轉…

閱讀更多...

Spring Boot 項目啟動自動執行邏輯的最佳實踐：掌握 CommandLineRunner

Spring Boot 項目啟動自動執行邏輯的最佳實踐：掌握 CommandLineRunner

前言 Spring Boot 啟動階段，總有些操作迫不及待沖在前線：配置要加載，數據要準備，日志要搶首發，仿佛個個爭當“啟動 MVP”。如果你也想讓項目一啟動就自動開工，少寫點手動觸發的“苦力邏輯”，那 CommandLineRunner 就是你的得力助手。它像那個永遠第一個打卡的同事，不喝…

閱讀更多...

高可用集群KEEPALIVED的詳細部署

高可用集群KEEPALIVED的詳細部署

一.高可用集群 1.1 集群類型 LB：Load Balance 負載均衡 LVS/HAProxy/nginx（http/upstream, stream/upstream） HA：High Availability 高可用集群數據庫、Redis SPoF: Single Point of Failure，解決單點故障 HPC&#x…

閱讀更多...

[論文閱讀] 人工智能 + 軟件工程 | NoCode-bench：評估LLM無代碼功能添加能力的新基準

[論文閱讀] 人工智能 + 軟件工程 | NoCode-bench：評估LLM無代碼功能添加能力的新基準

NoCode-bench：評估LLM無代碼功能添加能力的新基準論文：NoCode-bench: A Benchmark for Evaluating Natural Language-Driven Feature Addition 研究背景：當AI嘗試給軟件"加新功能"，我們需要一張靠譜的"考卷"…

閱讀更多...

【Git知識】Git 常用知識集合之基礎--分支系統與 Tag 標簽機制

【Git知識】Git 常用知識集合之基礎--分支系統與 Tag 標簽機制

🧰 Git 常用知識集合Git 是程序員的“時間機器”。這份手冊幫你從入門到精通，把 Git 玩明白。1?? Git 基礎操作流程 📌 三步走流程：添加 → 提交 → 推送 git add . # 把所有修改加入暫存區 git commit -m …

閱讀更多...

深入解析 Spark：關鍵問題與答案匯總

深入解析 Spark：關鍵問題與答案匯總

在大數據處理領域，Spark 憑借其高效的計算能力和豐富的功能，成為了眾多開發者和企業的首選框架。然而，在使用 Spark 的過程中，我們會遇到各種各樣的問題，從性能優化到算子使用等。本文將圍繞 Spark 的一些核心問題進行…

閱讀更多...

Python-初學openCV——對openCV的簡單使用

Python-初學openCV——對openCV的簡單使用

一、概述1、簡單介紹OpenCV（Open Source Computer Vision Library）是一個開源的計算機視覺庫，旨在為實時圖像處理提供強大的功能。它由Intel開發，現由開源社區維護。OpenCV 提供了跨平臺的解決方案，支持 Windows、Linu…

閱讀更多...

去中心化時代的通信革命：briefing與cpolar技術融合帶來的安全范式革新

去中心化時代的通信革命：briefing與cpolar技術融合帶來的安全范式革新

文章目錄前言1.關于briefing2.本地部署briefing3.使用briefing4.cpolar內網穿透工具安裝5.創建遠程連接公網地址6.固定briefing公網地址前言數字協作本該是提升效率的過程，卻被這些數據管理問題不斷困擾：平臺條款中的監控聲明、跨網絡環境的接入障礙、…

閱讀更多...

GitHub新手生存指南：AI項目版本控制與協作實戰

GitHub新手生存指南：AI項目版本控制與協作實戰

點擊 “AladdinEdu，同學們用得起的【H卡】算力平臺”，H卡級別算力，按量計費，靈活彈性，頂級配置，學生專屬優惠。代碼倉庫創建分支管理 PR提交開源項目復現讀者收獲：掌握團隊開發必備技能…

閱讀更多...

Axios封裝以及添加攔截器

Axios封裝以及添加攔截器

在前端開發中，http請求層的封裝可以極大提升代碼的復用性和可維護性，本文將完整的用axios封裝接口請求，配置請求與響應攔截器，封裝統一的請求方法全過程。封裝的目的和思路在項目直接用axios發送請求當然沒問題，但是如…

閱讀更多...

C語言中奇技淫巧04-僅對指定函數啟用編譯優化

C語言中奇技淫巧04-僅對指定函數啟用編譯優化

相信很多人使用GCC編譯代碼時，都會接觸到gcc -O0/1/2/3/s，知道它可以對工程進行全局優化。事實上，除了全局優化外，使用GCC擴展方式，我們還可以僅對部分關鍵函數實施差異化編譯優化。在GCC編譯器中，attrib…

閱讀更多...

HTML Style 對象深度解析：從基礎到高級應用

HTML Style 對象深度解析：從基礎到高級應用

一、Style 對象的核心概念定義與作用 Style 對象是 HTML DOM 中用于操作元素內聯樣式的接口，通過 element.style 訪問。它允許動態修改元素的 CSS 屬性，但僅能直接影響內聯樣式（即通過 style 屬性直接寫在標簽中的樣式）。與外部樣…

閱讀更多...

【C++】定義常量

【C++】定義常量

在 C 中，有兩種簡單的定義常量的方式： 使用 #define 預處理器。使用 const 關鍵字。 #define 預處理器 #include <iostream> using namespace std;#define LENGTH 10 #define WIDTH 5 #define NEWLINE \nint main() {int area; area LENGTH …

閱讀更多...

基于遺傳算法的多無人車協同偵察與安全保護策略優化

基于遺傳算法的多無人車協同偵察與安全保護策略優化

基于遺傳算法的多無人車協同偵察與安全保護策略優化前些天發現了一個巨牛的人工智能學習網站，通俗易懂，風趣幽默，忍不住分享一下給大家，覺得好請收藏。點擊跳轉到網站。 1. 引言 1.1 研究背景與意義隨著無人系統技術的快速發…

閱讀更多...

python面向對象編程詳解

python面向對象編程詳解

面向對象編程（OOP）是一種以對象為核心的編程范式。Python全面支持OOP，主要包含以下核心概念：一、類與對象1.類(Class)類是創建對象的模板或藍圖，它定義了對象的屬性和方法。class Dog:# 類屬性（所有實例共享…

閱讀更多...

快速入門Socket編程——封裝一套便捷的Socket編程——導論

快速入門Socket編程——封裝一套便捷的Socket編程——導論

快速入門Socket編程——封裝一套便捷的Socket編程——導論前言 ? 這里是筆者打算做的Socket編程的第二部分，也就是核心的討論我們Socket編程本身。導論 ? 我們知道，一個經典的服務器套接字的處理流程是如下的： 創建一個指定傳輸層和網絡層…

閱讀更多...

【Mermaid 離線工具】Mermaid 流程圖生成器 - 高清PNG輸出，一鍵生成專業級流程圖！

【Mermaid 離線工具】Mermaid 流程圖生成器 - 高清PNG輸出，一鍵生成專業級流程圖！

文章目錄 Mermaid 流程圖生成器（離線版本）：高效繪圖，離線也能玩轉專業可視化一、Mermaid：文本繪圖的 “魔法語法” 二、離線版生成器：功能與優勢解析（一）離線可用，場景更靈活（二）操作流程：簡單五步，產出專業圖表（三）界面設計：簡潔直觀，降低使用門檻三、應…

閱讀更多...

haproxy原理及實戰部署

haproxy原理及實戰部署

一、負載均衡負載均衡是網絡架構和分布式系統中至關重要的技術，其核心作用是將大量的并發請求或數據流量合理分配到多個服務器（或其他資源節點）上，從而解決單節點壓力過大、資源利用率低、系統穩定性差等問題。作用1. 提高系統吞…

閱讀更多...

jwt 在net9.0中做身份認證

jwt 在net9.0中做身份認證

一、新建net9.0項目WebApplication1，安裝包 <ItemGroup><PackageReference Include"Microsoft.AspNetCore.Authentication.JwtBearer" Version"9.0.7" /><PackageReference Include"Swashbuckle.AspNetCore" Version&…

閱讀更多...

【機器學習深度學習】微調能改變模型“智商”嗎？——模型能力與知識的本質解析

【機器學習深度學習】微調能改變模型“智商”嗎？——模型能力與知識的本質解析

目錄前言一、模型的“知識”與“能力”：兩種不同的智能第一種：淺層知識（記憶模式識別） 第二種：深層能力（推理理解） 二、微調：改變的是“經歷”，不是“天賦”…

閱讀更多...

最新文章