啥時候上RAG?啥時候上微調?丨實戰筆記

哈嘍,大家好👏

我是阿星!

現在很多AI科普文章都會提到微調,RAG。

但是沒有實戰的過的同學可能會問🤔——

啥時候用RAG?啥時候用微調呢?有啥區別?不都是讓模型增加知識面的嗎?

今天我們就對這個問題進行粗略歸類——

關于微調

你可以簡單理解為在預訓練之后(預訓練你可以簡單理解成自監督學習,得到一堆參數但是還不會自己回答)

——進行的一些QA對訓練,來教會模型組織語言,回答問題。

但是要注意微調是沒有對知識樣本做擴充的,擴充還是通過預訓練完成的。

微調之后才是基于人類反饋的強化學習。

簡單說就是預訓練👉微調👉強化學習,微調是中間這個環節。

不同微調之間有啥區別?

1、繼續預訓練-CPT:來增加知識、能力。補充模型在特定領域的缺陷。

2、微調訓練-SFT:給模型更多的QA對,來增強模型的依從性。常用于垂直大模型。這是現在最主要的方式。

3、偏好調優-DPO:用負反饋優化輸出,讓模型知道不能干啥,啥是錯的。

但是沒事也不用微調,不要聽到別人說微調自己也想微調……有很多已經調好的,可以去百煉云上看😂我之前也寫了一篇可以體驗簡版流程,實際比這個難n倍。零基礎也能體驗模型微調!魔塔+LLaMa Factory手把手教程

沒有必要,千萬別微調

優先級可以按照提示詞大于RAG大于微調。

1、針對特定行業/領域,如果模型根本就不具備特定知識,你可以用繼續預訓練-CPT。只不過數據上很多是1500萬字起步(下一篇推送會講講微調的數據質量要求有多可怕)

2、針對特定問題,微調訓練-SFT可以用RAG、提示詞、示例來做一些代替。因為SFT對數據質量要求要比RAG高,可以選擇不那么折騰直接上RAG

3、至于偏好調優-DPO,你可以選擇用提示詞示例。因為錯誤答案本身就對數據的要求更多了。你要枚舉多少回答來讓模型記住啥是錯的?

啥時候必須上微調

再好的提示詞都有輸出上的出入,如果是垂直指定的問題,你要求它回答的丁是丁卯是卯,那還是用微調最好。特別是金融和醫療。

1、比如在履職問題測評中,你需要對問題做嚴格分類,查詢特定的數據庫,也可能涉及到指定的關鍵詞。說白了就是場景足夠垂直。

2、高并發任務、對效率要求極高的場景,可以通過微調加速響應。

比如對即時主觀題打分,就會需要快速響應來適應考試節奏等。

3、特別是端側,很多服務都需要云端判斷,對定向場景需要的就是速度和準確度,離不開微調。

下一期我們詳細說說微調有多麻煩。我是阿星,我們下期再見。

往期文章:

一鍵榨干視頻干貨!這個開源神器讓90%知識博主慌了

普通提示詞vs工程級提示詞,掌握這4點

超酷!蘋果最新開源攝像頭會看的AI,fastvlm視覺模型真機實測

n8n教程:5分鐘部署+自動生AI日報并寫入飛書多維表格

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912736.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912736.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912736.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

RabbitMQ-基礎篇

前言: 今天開始學RabbitMQ,還是跟著黑馬的課程。 今日所學: RabbitMQ介紹RabbitMQ入門Java客戶端中的MQ 1.RabbitMQ介紹 1.1 什么是RabbitMQ RabbitMQ 是一個開源的消息代理軟件(消息隊列中間件),實現了高級消息…

docker-compose配置redis哨兵詳細步驟和配置文件

docker-compose配置redis哨兵詳細步驟和配置文件 目錄結構調整 redis-cluster/ ├── config/ │ ├── master.conf # 主節點配置 │ ├── slave1.conf # 從節點1配置 │ ├── slave2.conf # 從節點2配置 │ ├── sentinel1.…

多模態大語言模型arxiv論文略讀(146)

Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios ?? 論文標題:Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios ?? 論文作者:Yunkai Dang, Mengxi G…

【教程】Linux中限制用戶可以使用的GPU數量 | 附腳本

轉載請注明出處:小鋒學長生活大爆炸[xfxuezhagn.cn] 如果本文幫助到了你,歡迎[點贊、收藏、關注]哦~ 目錄 背景說明 設置方法 管理腳本 進階限制 恢復默認組 注意事項 背景說明 比較簡單的方式是使用group來管理權限,這種方式能限制哪些…

90.xilinx復位低電平(一般使用低電平復位)

Xilinx FPGA 中的寄存器(Flip-Flop)**確實支持異步復位**,但具體實現方式取決于你使用的設計方法(HDL 代碼風格或原語實例化)。以下是詳細說明: --- ### 1. **Xilinx 寄存器的復位特性** - **同步復位…

NVMe高速傳輸之擺脫XDMA設計10: DMA 控制單元設計

DMA 控制單元負責控制 DMA 傳輸事務, 該單元承擔了 DMA 事務到 NVMe 事務的轉換任務, 使用戶對數據傳輸事務的控制更加簡單快捷。 DMA 控制功能由 DMA寄存器組實現。 DMA 寄存器組包含 DMA 操作寄存器、 DMA 長度寄存器、 DMA 源目的地址寄存器和 DMA 狀…

如何設置電腦定時休眠?操作指南詳解

長時間運行電腦會導致硬件過熱,縮短其使用壽命。定時關機有助于讓硬件得到休息,降低因長時間高負荷工作導致損壞的風險。 它的界面簡潔直觀,功能卻十分實用,涵蓋了定時關機、重啟、注銷、休眠、待機以及鎖定等多種操作。 以設置“…

LeetCode[617]合并二叉樹

思路: 我們合并左右子樹,在遞歸左右子樹的時候,一定要保證左右子樹不為空,如果左子樹為空,那么直接返回右子樹就行了,即使右子樹為空。如果右子樹為空那么直接返回左子樹就行了,這樣判斷完就正常…

Redis 常用五大數據類型

1、Redis 關鍵字(Key) keys * 查看當前庫所有keyexists [key] 判斷某個key是否存在type [key] 查看當前key的數據類型del [key] 刪除指定的key數據unlink [key] 根據value選擇非阻塞刪除,僅將keys從keyspace元數據中刪除,真正的刪…

大語言模型(LLM)專業術語匯總

1. 訓練與部署 1.1 預訓練 專業:在海量無標注文本(如Common Crawl、Wikipedia)上通過自監督學習訓練基礎語言模型,學習通用語言表征(如GPT-3訓練數據達45TB)。通俗:AI的“通識教育階段”&…

【Java Swing 圖形界面編程】JList 列表組件 ① ( JList 組件簡介 | 核心作用 | 關鍵特性 | 基礎用法示例 )

文章目錄 一、JList 組件簡介1、JList 概念簡介2、JList 核心作用3、JList 關鍵特性 二、JList 組件基礎用法示例1、使用 String 數組構建列表項2、使用 Vector 集合構建列表項3、使用 DefaultListModel 構建列表項 一、JList 組件簡介 1、JList 概念簡介 基本概念 : JList 組件…

【小技巧】Python+PyCharm IDE 配置解釋器出錯,環境配置不完整或不兼容。(小智AI、MCP、聚合數據、實時新聞查詢、NBA賽事查詢)

報錯信息如下: [unsupported] Python 3.1 (mcp-calculator-main) (3) C:\Users(xsshu\AppData\Local\Programs\Python\Python313\python.exe [unsupported] Python 3.1 C:\Users\xsshu\AppData\Local\Programs\Python\Python311\python.exe 這條輸出顯示了兩個 Pyth…

Ragflow 前后端登錄邏輯

前端登錄邏輯 路由配置: /login 路由指向 /pages/login 組件。登錄表單使用 Ant Design 的 Form, Input, 和 Button 組件。 登錄表單處理: 使用 useLogin鉤子來處理登錄請求。密碼通過 RSA 加密后再發送到服務器。成功登錄后導航至 /knowledge 頁面。 …

基于圖神經網絡的ALS候選藥物預測模型設計與實現

基于圖神經網絡的ALS候選藥物預測模型設計與實現 一、任務背景與意義 肌萎縮側索硬化癥(ALS)是一種致命的神經退行性疾病,目前尚無有效治愈方法。傳統藥物發現流程耗時長、成本高,而人工智能技術為加速藥物發現提供了新途徑。本文設計并實現了一個基于圖神經網絡(GNN)的…

運維打鐵: 數據加密與備份恢復策略制定

文章目錄 思維導圖一、數據加密1. 加密算法選擇AES 加密示例(Python)RSA 加密示例(Python) 2. 密鑰管理3. 加密范圍 二、數據備份1. 備份類型全量備份增量備份差異備份 2. 備份頻率3. 備份存儲位置 三、數據恢復1. 恢復測試2. 恢復…

AIbase MCP服務庫上線:集成服務器、客戶端、案例教程等服務

在當今數字化時代,人工智能技術正以前所未有的速度發展,深刻地改變著我們的生活和工作方式。而要充分發揮AI的強大能力,離不開高效的工具和服務支持。今天,就讓我們來了解一下一個專注于MCP(Model Context Protocol&am…

QGIS+CesiumIon

前言 QGIS 3.44中,新增了3D 場景新增地球視圖模式,通過Cesium ion插件,支持谷歌全球傾斜模型的加載顯示。 目錄 1 CesiumIon插件安裝 2 加載谷歌全球傾斜模型 1、CesiumIon插件安裝 點擊菜單【Plugins】->【Manage and Install Plugins】…

TEXT Introduction

我們是誰 美國計算機奧林匹克競賽通過培訓、競賽和國際比賽來促進大學前的計算機學習。 數個教練將會組織、領導、陪伴代表美國參加國際性奧林匹克競賽的學生。 你可以在 USACO 官網了解更多。 USACO 的目標 USACO 的具體目標包括: 訓練美國的隊伍并且在下一屆奧…

Fluent許可服務器設置教程

Fluent作為一款廣泛使用的流體動力學模擬軟件,其高效的許可管理系統是確保順暢運行的關鍵。為了幫助您更好地掌握Fluent許可服務器的設置方法,本文將為您提供一份詳細的設置教程,讓您輕松配置,高效運行Fluent軟件。 一、Fluent許可…

vue3中實現高德地圖POI搜索(附源碼)

引言 上一篇文章詳細講解了vue3中實現高德地圖地址搜索自動提示(附源碼)🔗,本文將重點介紹POI搜索功能的實現。 1. 功能介紹 POI(Point of Interest) 搜索用于查找特定位置或區域內的興趣點,如餐館、商場、景點等。…