【大模型lora微調】關于推理時如何使用 LoRA Adapter

假設你有兩部分:

  • 一個是原始大模型(base?model)
  • 一個是保存的 LoRA?Adapter(adapter_config.json?+ adapter_model.bin)

不合并的情況下推理方法

你可以用?peft?的方式加載?LoRA?Adapter,推理時這樣寫:

from transformers import AutoModel, AutoTokenizer
from peft import PeftModel# 1. 加載原始大模型
base_model = AutoModel.from_pretrained("原始模型路徑",trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained("原始模型路徑",trust_remote_code=True
)# 2. 加載 LoRA Adapter
model = PeftModel.from_pretrained(base_model,"lora_adapter保存路徑"
)# 3. 推理
inputs = tokenizer("你的輸入", return_tensors="pt")
outputs = model.generate(**inputs)
print(tokenizer.decode(outputs[0]))
  • "原始模型路徑":假設就是你原始?ChatGLM-3?6B?的本地路徑
  • "lora_adapter保存路徑":就是你訓練保存的 lora?目錄

這樣就可以直接用 LoRA?微調后的模型推理,無需合并!


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/84489.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/84489.shtml
英文地址,請注明出處:http://en.pswp.cn/web/84489.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

谷歌時間序列算法:零樣本預測如何重塑行業決策?

谷歌時間序列算法:零樣本預測如何重塑行業決策? TimesFM 你是否曾面臨這樣的困境?—— ? 需要預測新產品銷量,卻苦于缺乏歷史數據; ? 依賴傳統模型(如ARIMA),但調參耗時且泛化能力…

國產服務器【銀河麒麟v10】【CPU鯤鵬920】部署Minio文件服務器

目錄 準備工作操作步驟1. 確認掛載點狀態2. 創建專用用戶和目錄3. 下載ARM版Minio到掛在盤4. 環境變量配置5. 更新Systemd服務配置6. 啟動、重啟7. 防火墻8. 訪問驗證9. 故障排查(如服務未啟動)? 結束 準備工作 環境要求:Linux虛擬機 操作…

解決: React Native android webview 空白頁

Android react-native-webview 之前是正常的, 升級了 react-native / react-native-webview 等 之后, 就變成了空白頁. 通過下面的修改, 可以修復, 回到正常的狀態. 來源: https://github.com/react-native-webview/react-native-webview/issues/3697 注意 ts 文件一定要改,…

高中編程教學中教師專業發展的困境與突破:基于實踐與理論的雙重審視

一、引言 1.1 研究背景 在數字化時代,編程已成為一項基本技能,其重要性日益凸顯。編程不僅是計算機科學領域的核心能力,更是培養學生邏輯思維、創新能力和問題解決能力的有效途徑。高中階段作為學生成長和發展的關鍵時期,開展編…

最小化聯邦平均(FedAvg)的算法開銷

一、通信開銷最小化 FedAvg中服務器與客戶端間的頻繁參數傳輸是主要瓶頸,可通過以下方法優化: 1. 模型壓縮技術 稀疏化:僅上傳重要參數更新(如Top-k梯度) 實現:客戶端本地訓練后,保留絕對值最…

準備開始適配高德Flutter的鴻蒙版了

我們的Flutter項目在編譯為鴻蒙的過程中, 遇到了各種插件不支持的問題。 大部分都能解決,或者用別的方式代替。 這個高德我真的是無語, 我們只能用高德 , 目前還沒看到網上有人適配了鴻蒙。 那就我來干吧, 第一…

webpack到vite的改造之路

前言 隨著前端項目的持續迭代與功能擴展,當前基于 Webpack 構建的項目在啟動速度、構建速度和首屏加載性能方面逐漸暴露出一些瓶頸。 一方面,Webpack 的打包機制導致本地開發環境的啟動時間顯著增加,嚴重影響了開發效率;另一方面…

【重構】如果發現提取的方法不再通用,如何重構

前言 所謂重構(refactoring): 在不改變代碼外在行為的前提下,對代碼做出修改,以改進程序的內部結構。 – Martin Fowler背景 最近在做需求,需要對方法加權限控制,發現舊方法不再適用&#xff0…

REST接口/RPC

REST接口(RESTful API)是一種基于HTTP協議的API設計風格,遵循REST(Representational State Transfer表述性狀態轉移)架構原則,用于在不同系統之間進行數據交互。它具有簡潔、靈活、無狀態等特點,廣泛應用于Web服務和移動應用開發中。 核心概念 資源導向 將數據或服務抽…

JS入門——事件與事件綁定

JS入門——事件與事件綁定 一、事件的分類 二、事件的綁定方式 實現代碼&#xff1a; <!DOCTYPE html> <html><head><meta charset"utf-8"><title>JS事件綁定</title></head><body><!-- 修復后的按鈕1 -->&…

pyspark 處理字符串函數

pyspark 要處理數據&#xff0c;沒有&#xff0c;那就偽造數據 faker 真是個好東西 from faker import Faker import pandas as pd gender ["None","Man","Woman"]fake Faker() names [(fake.first_name(),fake.last_name(),fake.date_of_bi…

五大經典語音芯片型號及應用場景

在語音芯片領域&#xff0c;這五大語音芯片憑借豐富多樣的產品和卓越的性能&#xff0c;占據了重要地位。以下為您詳細介紹其五款經典語音芯片型號及其對應的應用場景。? WTN6170-8S? WTN6170-8S 屬于 OTP 一次性語音芯片。它采用 OTP 工藝&#xff0c;成本能夠控制在 1 元以…

機器學習管道:構建高效可靠的AI工作流

在當今數據驅動的世界中&#xff0c;機器學習(ML)已成為推動創新和決策的核心技術。然而&#xff0c;將ML模型從實驗環境成功部署到生產環境并非易事。機器學習管道(ML Pipelines)作為一種系統化的解決方案&#xff0c;通過自動化工作流程&#xff0c;顯著提高了ML項目的可重復…

瀏覽器調試核心技術指南:從基礎到高級的完全掌握

引言?? 在現代前端開發中,瀏覽器調試工具已成為開發者最強大的技術伙伴。根據State of JS 2023的統計數據,??92.7%的專業開發者??每天使用瀏覽器DevTools進行問題診斷和性能優化。然而,多數初級開發者僅能使用不到35%的調試功能。本文將系統解析Chrome/Firefox瀏覽器…

OpenCV 圖像翻轉

一、知識點 1、void flip(InputArray src, OutputArray dst, int flipCode); (1)、圍繞x軸、y軸或兩者同時翻轉圖像。 (2)、參數說明: src: 輸入圖像。 dst: 輸出圖像&#xff0c;大小與類型和src相同。 flipCode: 翻轉標志。 0表示繞x軸翻轉(上下翻轉);…

【動手學深度學習】4.2~4.3 多層感知機的實現

目錄 4.2. 多層感知機的從零開始實現1&#xff09;初始化模型參數2&#xff09;激活函數3&#xff09;模型4&#xff09;損失函數5&#xff09;訓練 4.3. 多層感知機的簡潔實現1&#xff09;模型2&#xff09;小結 . 4.2. 多層感知機的從零開始實現 現在讓我們實現一個多層感…

54-Oracle 23 ai DBMS_HCHECK新改變-從前的hcheck.sql

Oracle Hcheck&#xff08;Health Check&#xff09;是Oracle數據庫內置的健康監測工具&#xff0c;自動化檢查數據庫的核心問題&#xff0c;包括數據字典一致性、性能瓶頸、空間使用及安全隱患。本質是數據字典的CT掃描儀&#xff0c;其核心價值在于將“字典邏輯錯誤”這類灰色…

AI 產品的“嵌點”(Embedded Touchpoints)

核心主題&#xff1a; AI 產品的成功不在于功能的強大與獨立&#xff0c;而在于其能否作為“嵌點”&#xff08;Embedded Touchpoints&#xff09;無縫融入用戶現有的行為流&#xff08;Flow&#xff09;&#xff0c;消除微小摩擦&#xff0c;在用戶真正需要的時機和場景中“無…

如何在WordPress中添加導航菜單?

作為一個用了很多年 WordPress 的用戶&#xff0c;我特別清楚導航菜單有多重要。一個清晰的導航菜單能讓訪問者快速找到他們想要的信息&#xff0c;同時也能提升網站的用戶體驗。而對于WordPress用戶來說&#xff0c;學會如何添加和自定義導航菜單是構建高質量網站的第一步。今…

【pdf】Java代碼生成PDF

目錄 依賴 創建單元格 表格數據行輔助添加方法 創建表頭單元格 創建下劃線 創建帶下劃線的文字 創建PDF 依賴 <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.4.2</version> <…