啥時候上RAG？啥時候上微調？丨實戰筆記

啥時候上RAG？啥時候上微調？丨實戰筆記

news/2025/7/3 8:40:26/文章來源:https://blog.csdn.net/seeyouintokyo/article/details/149058480

哈嘍，大家好👏

我是阿星！

現在很多AI科普文章都會提到微調，RAG。

但是沒有實戰的過的同學可能會問🤔——

啥時候用RAG？啥時候用微調呢？有啥區別？不都是讓模型增加知識面的嗎？

今天我們就對這個問題進行粗略歸類——

關于微調

你可以簡單理解為在預訓練之后（預訓練你可以簡單理解成自監督學習，得到一堆參數但是還不會自己回答）

——進行的一些QA對訓練，來教會模型組織語言，回答問題。

但是要注意微調是沒有對知識樣本做擴充的，擴充還是通過預訓練完成的。

微調之后才是基于人類反饋的強化學習。

簡單說就是預訓練👉微調👉強化學習，微調是中間這個環節。

不同微調之間有啥區別？

1、繼續預訓練-CPT：來增加知識、能力。補充模型在特定領域的缺陷。

2、微調訓練-SFT：給模型更多的QA對，來增強模型的依從性。常用于垂直大模型。這是現在最主要的方式。

3、偏好調優-DPO：用負反饋優化輸出，讓模型知道不能干啥，啥是錯的。

但是沒事也不用微調，不要聽到別人說微調自己也想微調……有很多已經調好的，可以去百煉云上看😂我之前也寫了一篇可以體驗簡版流程，實際比這個難n倍。零基礎也能體驗模型微調！魔塔+LLaMa Factory手把手教程

沒有必要，千萬別微調

優先級可以按照提示詞大于RAG大于微調。

1、針對特定行業/領域，如果模型根本就不具備特定知識，你可以用繼續預訓練-CPT。只不過數據上很多是1500萬字起步（下一篇推送會講講微調的數據質量要求有多可怕）

2、針對特定問題，微調訓練-SFT可以用RAG、提示詞、示例來做一些代替。因為SFT對數據質量要求要比RAG高，可以選擇不那么折騰直接上RAG

3、至于偏好調優-DPO，你可以選擇用提示詞示例。因為錯誤答案本身就對數據的要求更多了。你要枚舉多少回答來讓模型記住啥是錯的？

啥時候必須上微調

再好的提示詞都有輸出上的出入，如果是垂直指定的問題，你要求它回答的丁是丁卯是卯，那還是用微調最好。特別是金融和醫療。

1、比如在履職問題測評中，你需要對問題做嚴格分類，查詢特定的數據庫，也可能涉及到指定的關鍵詞。說白了就是場景足夠垂直。

2、高并發任務、對效率要求極高的場景，可以通過微調加速響應。

比如對即時主觀題打分，就會需要快速響應來適應考試節奏等。

3、特別是端側，很多服務都需要云端判斷，對定向場景需要的就是速度和準確度，離不開微調。

下一期我們詳細說說微調有多麻煩。我是阿星，我們下期再見。

往期文章：

一鍵榨干視頻干貨！這個開源神器讓90%知識博主慌了

普通提示詞vs工程級提示詞，掌握這4點

超酷！蘋果最新開源攝像頭會看的AI，fastvlm視覺模型真機實測

n8n教程：5分鐘部署+自動生AI日報并寫入飛書多維表格

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/912736.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/912736.shtml
英文地址，請注明出處：http://en.pswp.cn/news/912736.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

RabbitMQ-基礎篇

RabbitMQ-基礎篇

前言： 今天開始學RabbitMQ,還是跟著黑馬的課程。今日所學： RabbitMQ介紹RabbitMQ入門Java客戶端中的MQ 1.RabbitMQ介紹 1.1 什么是RabbitMQ RabbitMQ 是一個開源的消息代理軟件（消息隊列中間件），實現了高級消息…

閱讀更多...

docker-compose配置redis哨兵詳細步驟和配置文件

docker-compose配置redis哨兵詳細步驟和配置文件

docker-compose配置redis哨兵詳細步驟和配置文件目錄結構調整 redis-cluster/ ├── config/ │ ├── master.conf # 主節點配置 │ ├── slave1.conf # 從節點1配置 │ ├── slave2.conf # 從節點2配置 │ ├── sentinel1.…

閱讀更多...

多模態大語言模型arxiv論文略讀（146）

多模態大語言模型arxiv論文略讀（146）

Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios ?? 論文標題：Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios ?? 論文作者：Yunkai Dang, Mengxi G…

閱讀更多...

【教程】Linux中限制用戶可以使用的GPU數量 | 附腳本

【教程】Linux中限制用戶可以使用的GPU數量 | 附腳本

轉載請注明出處：小鋒學長生活大爆炸[xfxuezhagn.cn] 如果本文幫助到了你，歡迎[點贊、收藏、關注]哦~ 目錄背景說明設置方法管理腳本進階限制恢復默認組注意事項背景說明比較簡單的方式是使用group來管理權限，這種方式能限制哪些…

閱讀更多...

90.xilinx復位低電平(一般使用低電平復位)

90.xilinx復位低電平(一般使用低電平復位)

Xilinx FPGA 中的寄存器（Flip-Flop）**確實支持異步復位**，但具體實現方式取決于你使用的設計方法（HDL 代碼風格或原語實例化）。以下是詳細說明： --- ### 1. **Xilinx 寄存器的復位特性** - **同步復位…

閱讀更多...

NVMe高速傳輸之擺脫XDMA設計10: DMA 控制單元設計

NVMe高速傳輸之擺脫XDMA設計10: DMA 控制單元設計

DMA 控制單元負責控制 DMA 傳輸事務， 該單元承擔了 DMA 事務到 NVMe 事務的轉換任務， 使用戶對數據傳輸事務的控制更加簡單快捷。 DMA 控制功能由 DMA寄存器組實現。 DMA 寄存器組包含 DMA 操作寄存器、 DMA 長度寄存器、 DMA 源目的地址寄存器和 DMA 狀…

閱讀更多...

如何設置電腦定時休眠？操作指南詳解

如何設置電腦定時休眠？操作指南詳解

長時間運行電腦會導致硬件過熱，縮短其使用壽命。定時關機有助于讓硬件得到休息，降低因長時間高負荷工作導致損壞的風險。它的界面簡潔直觀，功能卻十分實用，涵蓋了定時關機、重啟、注銷、休眠、待機以及鎖定等多種操作。以設置“…

閱讀更多...

LeetCode[617]合并二叉樹

LeetCode[617]合并二叉樹

思路： 我們合并左右子樹，在遞歸左右子樹的時候，一定要保證左右子樹不為空，如果左子樹為空，那么直接返回右子樹就行了，即使右子樹為空。如果右子樹為空那么直接返回左子樹就行了，這樣判斷完就正常…

閱讀更多...

Redis 常用五大數據類型

Redis 常用五大數據類型

1、Redis 關鍵字（Key） keys * 查看當前庫所有keyexists [key] 判斷某個key是否存在type [key] 查看當前key的數據類型del [key] 刪除指定的key數據unlink [key] 根據value選擇非阻塞刪除，僅將keys從keyspace元數據中刪除，真正的刪…

閱讀更多...

大語言模型（LLM）專業術語匯總

大語言模型（LLM）專業術語匯總

1. 訓練與部署 1.1 預訓練專業：在海量無標注文本（如Common Crawl、Wikipedia）上通過自監督學習訓練基礎語言模型，學習通用語言表征（如GPT-3訓練數據達45TB）。通俗：AI的“通識教育階段”&…

閱讀更多...

【Java Swing 圖形界面編程】JList 列表組件 ① ( JList 組件簡介 | 核心作用 | 關鍵特性 | 基礎用法示例 )

【Java Swing 圖形界面編程】JList 列表組件 ① ( JList 組件簡介 | 核心作用 | 關鍵特性 | 基礎用法示例 )

文章目錄一、JList 組件簡介1、JList 概念簡介2、JList 核心作用3、JList 關鍵特性二、JList 組件基礎用法示例1、使用 String 數組構建列表項2、使用 Vector 集合構建列表項3、使用 DefaultListModel 構建列表項一、JList 組件簡介 1、JList 概念簡介基本概念 : JList 組件…

閱讀更多...

【小技巧】Python+PyCharm IDE 配置解釋器出錯，環境配置不完整或不兼容。(小智AI、MCP、聚合數據、實時新聞查詢、NBA賽事查詢)

【小技巧】Python+PyCharm IDE 配置解釋器出錯，環境配置不完整或不兼容。(小智AI、MCP、聚合數據、實時新聞查詢、NBA賽事查詢)

報錯信息如下： [unsupported] Python 3.1 (mcp-calculator-main) (3) C:\Users(xsshu\AppData\Local\Programs\Python\Python313\python.exe [unsupported] Python 3.1 C:\Users\xsshu\AppData\Local\Programs\Python\Python311\python.exe 這條輸出顯示了兩個 Pyth…

閱讀更多...

Ragflow 前后端登錄邏輯

Ragflow 前后端登錄邏輯

前端登錄邏輯路由配置： /login 路由指向 /pages/login 組件。登錄表單使用 Ant Design 的 Form, Input, 和 Button 組件。登錄表單處理： 使用 useLogin鉤子來處理登錄請求。密碼通過 RSA 加密后再發送到服務器。成功登錄后導航至 /knowledge 頁面。 …

閱讀更多...

基于圖神經網絡的ALS候選藥物預測模型設計與實現

基于圖神經網絡的ALS候選藥物預測模型設計與實現

基于圖神經網絡的ALS候選藥物預測模型設計與實現一、任務背景與意義肌萎縮側索硬化癥（ALS）是一種致命的神經退行性疾病，目前尚無有效治愈方法。傳統藥物發現流程耗時長、成本高，而人工智能技術為加速藥物發現提供了新途徑。本文設計并實現了一個基于圖神經網絡（GNN）的…

閱讀更多...

運維打鐵: 數據加密與備份恢復策略制定

運維打鐵: 數據加密與備份恢復策略制定

文章目錄思維導圖一、數據加密1. 加密算法選擇AES 加密示例（Python）RSA 加密示例（Python） 2. 密鑰管理3. 加密范圍二、數據備份1. 備份類型全量備份增量備份差異備份 2. 備份頻率3. 備份存儲位置三、數據恢復1. 恢復測試2. 恢復…

閱讀更多...

AIbase MCP服務庫上線：集成服務器、客戶端、案例教程等服務

AIbase MCP服務庫上線：集成服務器、客戶端、案例教程等服務

在當今數字化時代，人工智能技術正以前所未有的速度發展，深刻地改變著我們的生活和工作方式。而要充分發揮AI的強大能力，離不開高效的工具和服務支持。今天，就讓我們來了解一下一個專注于MCP（Model Context Protocol&am…

閱讀更多...

QGIS+CesiumIon

QGIS+CesiumIon

前言 QGIS 3.44中，新增了3D 場景新增地球視圖模式，通過Cesium ion插件，支持谷歌全球傾斜模型的加載顯示。目錄 1 CesiumIon插件安裝 2 加載谷歌全球傾斜模型 1、CesiumIon插件安裝點擊菜單【Plugins】->【Manage and Install Plugins】…

閱讀更多...

TEXT Introduction

TEXT Introduction

我們是誰美國計算機奧林匹克競賽通過培訓、競賽和國際比賽來促進大學前的計算機學習。數個教練將會組織、領導、陪伴代表美國參加國際性奧林匹克競賽的學生。你可以在 USACO 官網了解更多。 USACO 的目標 USACO 的具體目標包括： 訓練美國的隊伍并且在下一屆奧…

閱讀更多...

Fluent許可服務器設置教程

Fluent許可服務器設置教程

Fluent作為一款廣泛使用的流體動力學模擬軟件，其高效的許可管理系統是確保順暢運行的關鍵。為了幫助您更好地掌握Fluent許可服務器的設置方法，本文將為您提供一份詳細的設置教程，讓您輕松配置，高效運行Fluent軟件。一、Fluent許可…

閱讀更多...

vue3中實現高德地圖POI搜索（附源碼）

vue3中實現高德地圖POI搜索（附源碼）

引言上一篇文章詳細講解了vue3中實現高德地圖地址搜索自動提示（附源碼）🔗，本文將重點介紹POI搜索功能的實現。 1. 功能介紹 POI(Point of Interest) 搜索用于查找特定位置或區域內的興趣點，如餐館、商場、景點等。…

閱讀更多...

最新文章