【大模型lora微調】關于推理時如何使用 LoRA Adapter

【大模型lora微調】關于推理時如何使用 LoRA Adapter

web/2025/6/21 21:04:19/文章來源:https://blog.csdn.net/weixin_41645791/article/details/148777789

假設你有兩部分：

一個是原始大模型（base?model）

一個是保存的 LoRA?Adapter（adapter_config.json?+ adapter_model.bin）

不合并的情況下推理方法

你可以用?peft?的方式加載?LoRA?Adapter，推理時這樣寫：

from transformers import AutoModel, AutoTokenizer
from peft import PeftModel# 1. 加載原始大模型
base_model = AutoModel.from_pretrained("原始模型路徑",trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained("原始模型路徑",trust_remote_code=True
)# 2. 加載 LoRA Adapter
model = PeftModel.from_pretrained(base_model,"lora_adapter保存路徑"
)# 3. 推理
inputs = tokenizer("你的輸入", return_tensors="pt")
outputs = model.generate(**inputs)
print(tokenizer.decode(outputs[0]))

"原始模型路徑"：假設就是你原始?ChatGLM-3?6B?的本地路徑

"lora_adapter保存路徑"：就是你訓練保存的 lora?目錄

這樣就可以直接用 LoRA?微調后的模型推理，無需合并！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/84489.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/84489.shtml
英文地址，請注明出處：http://en.pswp.cn/web/84489.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

谷歌時間序列算法：零樣本預測如何重塑行業決策？

谷歌時間序列算法：零樣本預測如何重塑行業決策？

谷歌時間序列算法：零樣本預測如何重塑行業決策？ TimesFM 你是否曾面臨這樣的困境？—— ? 需要預測新產品銷量，卻苦于缺乏歷史數據； ? 依賴傳統模型（如ARIMA），但調參耗時且泛化能力…

閱讀更多...

國產服務器【銀河麒麟v10】【CPU鯤鵬920】部署Minio文件服務器

國產服務器【銀河麒麟v10】【CPU鯤鵬920】部署Minio文件服務器

目錄準備工作操作步驟1. 確認掛載點狀態2. 創建專用用戶和目錄3. 下載ARM版Minio到掛在盤4. 環境變量配置5. 更新Systemd服務配置6. 啟動、重啟7. 防火墻8. 訪問驗證9. 故障排查（如服務未啟動）? 結束準備工作環境要求：Linux虛擬機操作…

閱讀更多...

解決: React Native android webview 空白頁

解決: React Native android webview 空白頁

Android react-native-webview 之前是正常的, 升級了 react-native / react-native-webview 等之后, 就變成了空白頁. 通過下面的修改, 可以修復, 回到正常的狀態. 來源: https://github.com/react-native-webview/react-native-webview/issues/3697 注意 ts 文件一定要改,…

閱讀更多...

高中編程教學中教師專業發展的困境與突破：基于實踐與理論的雙重審視

高中編程教學中教師專業發展的困境與突破：基于實踐與理論的雙重審視

一、引言 1.1 研究背景在數字化時代，編程已成為一項基本技能，其重要性日益凸顯。編程不僅是計算機科學領域的核心能力，更是培養學生邏輯思維、創新能力和問題解決能力的有效途徑。高中階段作為學生成長和發展的關鍵時期，開展編…

閱讀更多...

最小化聯邦平均（FedAvg）的算法開銷

最小化聯邦平均（FedAvg）的算法開銷

一、通信開銷最小化 FedAvg中服務器與客戶端間的頻繁參數傳輸是主要瓶頸，可通過以下方法優化： 1. 模型壓縮技術稀疏化：僅上傳重要參數更新（如Top-k梯度） 實現：客戶端本地訓練后，保留絕對值最…

閱讀更多...

準備開始適配高德Flutter的鴻蒙版了

準備開始適配高德Flutter的鴻蒙版了

我們的Flutter項目在編譯為鴻蒙的過程中， 遇到了各種插件不支持的問題。大部分都能解決，或者用別的方式代替。這個高德我真的是無語， 我們只能用高德 ， 目前還沒看到網上有人適配了鴻蒙。那就我來干吧， 第一…

閱讀更多...

webpack到vite的改造之路

webpack到vite的改造之路

前言隨著前端項目的持續迭代與功能擴展，當前基于 Webpack 構建的項目在啟動速度、構建速度和首屏加載性能方面逐漸暴露出一些瓶頸。一方面，Webpack 的打包機制導致本地開發環境的啟動時間顯著增加，嚴重影響了開發效率；另一方面…

閱讀更多...

【重構】如果發現提取的方法不再通用，如何重構

【重構】如果發現提取的方法不再通用，如何重構

前言所謂重構（refactoring）： 在不改變代碼外在行為的前提下，對代碼做出修改，以改進程序的內部結構。 – Martin Fowler背景最近在做需求，需要對方法加權限控制，發現舊方法不再適用&#xff0…

閱讀更多...

REST接口/RPC

REST接口/RPC

REST接口（RESTful API）是一種基于HTTP協議的API設計風格，遵循REST（Representational State Transfer表述性狀態轉移）架構原則，用于在不同系統之間進行數據交互。它具有簡潔、靈活、無狀態等特點，廣泛應用于Web服務和移動應用開發中。核心概念資源導向將數據或服務抽…

閱讀更多...

JS入門——事件與事件綁定

JS入門——事件與事件綁定

JS入門——事件與事件綁定一、事件的分類二、事件的綁定方式實現代碼： <!DOCTYPE html> <html><head><meta charset"utf-8"><title>JS事件綁定</title></head><body>&…

閱讀更多...

pyspark 處理字符串函數

pyspark 處理字符串函數

pyspark 要處理數據，沒有，那就偽造數據 faker 真是個好東西 from faker import Faker import pandas as pd gender ["None","Man","Woman"]fake Faker() names [(fake.first_name(),fake.last_name(),fake.date_of_bi…

閱讀更多...

五大經典語音芯片型號及應用場景

五大經典語音芯片型號及應用場景

在語音芯片領域，這五大語音芯片憑借豐富多樣的產品和卓越的性能，占據了重要地位。以下為您詳細介紹其五款經典語音芯片型號及其對應的應用場景。? WTN6170-8S? WTN6170-8S 屬于 OTP 一次性語音芯片。它采用 OTP 工藝，成本能夠控制在 1 元以…

閱讀更多...

機器學習管道：構建高效可靠的AI工作流

機器學習管道：構建高效可靠的AI工作流

在當今數據驅動的世界中，機器學習(ML)已成為推動創新和決策的核心技術。然而，將ML模型從實驗環境成功部署到生產環境并非易事。機器學習管道(ML Pipelines)作為一種系統化的解決方案，通過自動化工作流程，顯著提高了ML項目的可重復…

閱讀更多...

瀏覽器調試核心技術指南：從基礎到高級的完全掌握

瀏覽器調試核心技術指南：從基礎到高級的完全掌握

引言?? 在現代前端開發中，瀏覽器調試工具已成為開發者最強大的技術伙伴。根據State of JS 2023的統計數據，??92.7%的專業開發者??每天使用瀏覽器DevTools進行問題診斷和性能優化。然而，多數初級開發者僅能使用不到35%的調試功能。本文將系統解析Chrome/Firefox瀏覽器…

閱讀更多...

OpenCV 圖像翻轉

OpenCV 圖像翻轉

一、知識點 1、void flip(InputArray src, OutputArray dst, int flipCode); (1)、圍繞x軸、y軸或兩者同時翻轉圖像。 (2)、參數說明: src: 輸入圖像。 dst: 輸出圖像，大小與類型和src相同。 flipCode: 翻轉標志。 0表示繞x軸翻轉(上下翻轉);…

閱讀更多...

【動手學深度學習】4.2~4.3 多層感知機的實現

【動手學深度學習】4.2~4.3 多層感知機的實現

目錄 4.2. 多層感知機的從零開始實現1）初始化模型參數2）激活函數3）模型4）損失函數5）訓練 4.3. 多層感知機的簡潔實現1）模型2）小結 . 4.2. 多層感知機的從零開始實現現在讓我們實現一個多層感…

閱讀更多...

54-Oracle 23 ai DBMS_HCHECK新改變-從前的hcheck.sql

54-Oracle 23 ai DBMS_HCHECK新改變-從前的hcheck.sql

Oracle Hcheck（Health Check）是Oracle數據庫內置的健康監測工具，自動化檢查數據庫的核心問題，包括數據字典一致性、性能瓶頸、空間使用及安全隱患。本質是數據字典的CT掃描儀，其核心價值在于將“字典邏輯錯誤”這類灰色…

閱讀更多...

AI 產品的“嵌點”（Embedded Touchpoints）

AI 產品的“嵌點”（Embedded Touchpoints）

核心主題： AI 產品的成功不在于功能的強大與獨立，而在于其能否作為“嵌點”（Embedded Touchpoints）無縫融入用戶現有的行為流（Flow），消除微小摩擦，在用戶真正需要的時機和場景中“無…

閱讀更多...

如何在WordPress中添加導航菜單？

如何在WordPress中添加導航菜單？

作為一個用了很多年 WordPress 的用戶，我特別清楚導航菜單有多重要。一個清晰的導航菜單能讓訪問者快速找到他們想要的信息，同時也能提升網站的用戶體驗。而對于WordPress用戶來說，學會如何添加和自定義導航菜單是構建高質量網站的第一步。今…

閱讀更多...

【pdf】Java代碼生成PDF

【pdf】Java代碼生成PDF

目錄依賴創建單元格表格數據行輔助添加方法創建表頭單元格創建下劃線創建帶下劃線的文字創建PDF 依賴 <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.4.2</version> <…

閱讀更多...

最新文章