上下文微調(Contextual Fine-Tuning, CFT)提高大型語言模型(LLMs)在特定領域的學習和推理能力

大型語言模型(LLMs)在開放領域任務中表現出色,但在快速演變的專業領域(如醫學、金融)中面臨挑戰:

  • 知識更新難題:傳統指令微調(Instruction Fine-Tuning, IFT)依賴顯式指令,難以適應動態知識。
  • 災難性遺忘:持續預訓練(Continued Pretraining, CPT)可能導致模型遺忘已有知識。
  • 推理能力限制:模型難以通過純文本學習建立領域內深層語義關聯。

本文提出上下文微調(Contextual Fine-Tuning, CFT),通過模擬人類認知策略的提示語,結合上下文學習和微調的方法,通過簡單的領域自適應提示顯著提高了LLMs在新領域的知識獲取和開放式推理能力。實驗結果表明,CFT在醫療和金融領域的基準測試中均優于傳統的持續預訓練和指令微調方法。
CFT在處理領域特定數據時的具體優勢:

?提高學習效率:CFT通過上下文提示提供額外的語義信息,幫助模型更好地理解和學習新領域的知識,從而提高了學習效率。實驗表明,CFT模型在訓練過程中損失更低,收斂速度更快。

?增強模型性能:CFT在多個醫療和財務基準測試中均表現出優于CPT和IFT的性能。例如,在醫療領域的多選題數據集中,CFT的平均準確率提高了4.89%。

?減少遺忘:CFT通過結合上下文學習和微調,能夠在學習新領域知識的同時保留已有的知識,減少了知識遺忘的現象。這與傳統的持續預訓練方法相比具有顯著優勢。

?適用性廣泛:CFT不僅適用于生物醫學領域,還可以擴展到其他領域,如金融、法律等,顯示出其廣泛的適用性和靈活性。


方法創新:上下文微調(CFT)

核心思想

  • 認知策略驅動:設計受教育學理論啟發的上下文提示(如“關注核心概念”“批判性分析”),引導模型學習新知識時的語義理解。
  • 梯度對齊:通過提示語控制模型優化方向,減少無效參數更新,緩解遺忘問題。

技術實現

  1. 輸入構造
    在原始輸入序列前添加上下文提示語,例如:
    "Critically analyze the upcoming information. Look for underlying assumptions..."
    形成新輸入:[提示語] + [原始文本]

通過指導GPT-4o-mini根據每個訓練批次的內容創建提示來自動生成上下文提示。
具體來說,我們使用以下指令模板:在這里插入圖片描述在此模板中,{{ INSTRUCTION }}被替換為從以下五種不同指令中抽取的一個樣本指令,以生成多種提示:

  1. “給定以下文本,生成一個鼓勵讀者關注所呈現的主要觀點和主題的上下文提示。該上下文提示應簡潔并幫助讀者深入參與內容。”
  2. “分析下面的文本,并創建一個引導讀者批判性地思考內容的上下文提示,質疑假設并評估論點。”提示應鼓勵讀者考慮文中提出的不同觀點。
  3. “閱讀文本,并生成一個情境提示,鼓勵讀者思考信息如何與他們現有的知識或經驗相聯系。提示應促進新見解與先前理解的整合。”
  4. “閱讀以下文本,并創建一個情境提示,引導讀者用自己的話總結主要觀點。提示應鼓勵綜合信息以便更好地理解。”
  5. “根據下面的文本,制定一個情境提示,引導讀者比較和對比所介紹的概念與相關話題或先前知識。提示應幫助識別相似之處和差異。”

同樣,{{ TEXT }} 會被每批的文本替換。
以下是適用于 OpenMedText 的生成的上下文提示示例:

  1. “對這項關于 PCR 技術和 LeHV-5 檢測的研究中的方法和發現進行批判性評估。實驗設計的基礎假設是什么?是否有其他方法或觀點可以挑戰或補充所提出的論點?考慮這些方法對更廣泛的獸醫醫學科學研究和診斷的影響。”
  2. “思考鉀離子通道與癌癥治療中的化療耐藥性之間的復雜關系。所呈現的機制與你之前對癌細胞生物學和耐藥性的了解有何比較?確定不同類型癌癥中 K+通道的作用的異同及其對治療策略的影響。考慮將這種理解納入臨床實踐的潛在途徑。”
  3. “從多個角度考慮學校早餐參與情況的發現及其對學生健康的影響。教育工作者、政策制定者、學校管理人員和醫療保健專業人員可能如何不同地解釋這些結果?思考每個利益相關者如何在其各自的角色中使用這些信息來改善學生健康和教育成果。”
  1. 訓練目標
    損失函數定義為:
    L C F T ( θ ) = ? E x , c ∑ k = 1 n log ? P θ ( x k ∣ c , x < k ) \mathcal{L}_{CFT}(\theta) = -\mathbb{E}_{x,c} \sum_{k=1}^n \log P_\theta(x_k | c, x_{<k}) LCFT?(θ)=?Ex,c?k=1n?logPθ?(xk?c,x

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/72101.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/72101.shtml
英文地址,請注明出處:http://en.pswp.cn/web/72101.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

在 LaTeX 中強制表格位于頁面頂部

在 LaTeX 中強制表格位于頁面頂部&#xff0c;可以通過以下 多種方法結合使用&#xff0c;按優先級推薦&#xff1a; 方法 1&#xff1a;使用 [!t] 位置限定符 原理&#xff1a;通過 [!t] 強制 LaTeX 優先將表格放置在頁面頂部&#xff08;Top&#xff09;&#xff0c;! 表示忽…

kotlin與MVVM的結合使用總結(二)

在 MVVM&#xff08;Model - View - ViewModel&#xff09;架構中&#xff0c;M 層即 Model 層&#xff0c;主要負責數據的管理、存儲和獲取&#xff0c;它與業務邏輯和數據處理相關。在 Kotlin 中實現 MVVM 的 M 層&#xff0c;通常會涉及數據類的定義、數據的本地存儲與遠程獲…

電子元器件選型與實戰應用—16 怎么選一個合適的MCU芯片?

文章目錄 1. 選型要素1.1 價格1.2 技術支持1.3 廠家優勢1.4 功耗1.5 特殊功能1.6 統計外設1.7 確定外設占用的內存和flash大小1.8 確定外設通信接口1.9 確定外設通信接口的電平1.10 確定外設的GPIO數量1.11 確定外設的供電和功耗1.12 確定外設GPIO的種類1.13 確定ADC的數量1.14…

VSCode 搭建C++編程環境 2025新版圖文安裝教程(100%搭建成功,VSCode安裝+C++環境搭建+運行測試+背景圖設置)

名人說&#xff1a;博觀而約取&#xff0c;厚積而薄發。——蘇軾《稼說送張琥》 創作者&#xff1a;Code_流蘇(CSDN)&#xff08;一個喜歡古詩詞和編程的Coder&#x1f60a;&#xff09; 目錄 一、VScode下載及安裝二、安裝 MinGW-w64 工具鏈三、Windows環境變量配置四、檢查 M…

Django系列教程(7)——路由配置URLConf

目錄 URLconf是如何工作的? path和re_path方法 更多URL配置示例 URL的命名及reverse()方法 使用命名URL 硬編碼URL - 不建議 URL指向基于類的視圖(View) 通過URL傳遞額外的參數 小結 Django的項目文件夾和每個應用(app)目錄下都有urls.py文件&#xff0c;它們構成了D…

transformer bert 多頭自注意力

輸入的&#xff08;a1,a2,a3,a4&#xff09;是最終嵌入&#xff0c;是一個(512,768)的矩陣&#xff1b;而a1是一個token&#xff0c;尺寸是768 a1通過wq權重矩陣&#xff0c;經過全連接變換得到查詢向量q1&#xff1b;a2通過Wk權重矩陣得到鍵向量k2&#xff1b;q和k點乘就是值…

Spring Boot + MyBatis-Plus 項目目錄結構

以下是一個標準的 Spring Boot MyBatis-Plus 項目目錄結構及文件命名規范&#xff0c;包含每個目錄和文件的作用說明&#xff0c;適用于中大型項目開發&#xff1a; 項目根目錄結構 src/ ├── main/ │ ├── java/ # Java 源代碼 │ │ └── com/…

Webpack優化前端性能

Webpack優化前端性能☆☆ 涵蓋了代碼分割、懶加載、壓縮、緩存優化、Tree Shaking、圖片優化、CDN使用等多個方面。 Webpack優化前端性能詳解(2025綜合實踐版) Webpack作為現代前端工程化的核心工具,其優化能力直接影響項目的首屏速度、交互流暢度和用戶體驗。以下從代碼維…

ardunio R4 WiFi連接實戰

ardunio WiFi連接模板 ardunio R4 WiFi 開發板有著不錯的性能和板載內存&#xff0c;本機自帶 WiFi 連接模塊&#xff0c;可以完成簡單的網絡服務。對于這個小東西我情有獨鐘&#xff0c;也總希望能夠用它來做些什么&#xff0c;所以先從 WiFi 連接開始學起&#xff0c;未來考…

C++11 編譯使用 aws-cpp-sdk

一、對sdk的編譯前準備 1、軟件需求 此文檔針對于在Linux系統上使用源碼進行編譯開發操作系統使用原生的contos7Linux。機器配置建議 內存8G以上,CPU 4個 以上GCC 4.9.0 及以上版本Cmake 3.12以上 3.21以下apt install libcurl-devel openssl-devel libuuid-devel pulseaudio-…

得物 Android Crash 治理實踐

一、前言 通過修復歷史遺留的Crash漏報問題&#xff08;包括端側SDK采集的兼容性優化及Crash平臺的數據消費機制完善&#xff09;&#xff0c;得物Android端的Crash監控體系得到顯著增強&#xff0c;使得歷史Crash數據的完整捕獲能力得到系統性改善&#xff0c;相應Crash指標也…

SpringBoot3+Lombok如何配置logback輸出日志到文件

Background/Requirement SpringBoot3Lombok如何配置logback輸出日志到文件&#xff0c;因為我需要對這些日志進行輸出&#xff0c;控制臺輸出和文件輸出&#xff0c;文件輸出是為了更好的作為AuditLog且支持滾動式備份&#xff0c;每天一個文件。 Technical Solution 1.確保你…

主流向量數據庫對比

在 AI 的 RAG&#xff08;檢索增強生成&#xff09;研發領域&#xff0c;向量數據庫是存儲和查詢向量嵌入的核心工具&#xff0c;用于支持高效的語義搜索和信息檢索。向量嵌入是文本或其他非結構化數據的數值表示&#xff0c;RAG 系統通過這些嵌入從知識庫中檢索相關信息&#…

搞定python之四----函數、lambda和模塊

本文是《搞定python》系列專欄的第四篇&#xff0c;通過代碼演示列python自定義函數、lambda和模塊的用法。本文學習完成后&#xff0c;python的基礎知識就完了。后面會學習面向對象的內容。 1、自定義函數 # 測試python自定義函數# 有參數&#xff0c;沒有返回值 def say_he…

[操作系統] 學校課程關于“靜態優先級搶占式調度“作業

今天我們來分享兩道題目哈, 學校弄得題目. T1: 靜態優先級, 搶占式(1為高優先級) 圖解: 以下是靜態優先級搶占式調度的解題過程和結果&#xff1a; 解題思路&#xff1a; 優先級規則&#xff1a; 數值越小優先級越高。新進程到達時&#xff0c;若其優先級高于當前運行進程&…

洛谷P1320 壓縮技術(續集版)

P1320 壓縮技術&#xff08;續集版&#xff09; 題目描述 設某漢字由 N N N \times N NN 的 0 \texttt 0 0 和 1 \texttt 1 1 的點陣圖案組成。 我們依照以下規則生成壓縮碼。連續一組數值&#xff1a;從漢字點陣圖案的第一行第一個符號開始計算&#xff0c;按書寫順序從…

使用DeepSeek完成一個簡單嵌入式開發

開啟DeepSeek對話 請幫我使用Altium Designer設計原理圖、PCB&#xff0c;使用keil完成代碼編寫&#xff1b;要求&#xff1a;使用stm32F103RCT6為主控芯片&#xff0c;控制3個流水燈的原理圖 這里需要注意&#xff0c;每次DeepSeek的回答都不太一樣。 DeepSeek回答 以下是使…

volatile、synchronized和Lock

名詞解釋&#xff1a; 指令重排是計算機為了優化執行效率&#xff0c;在不改變單線程程序結果的前提下&#xff0c;對代碼的執行順序進行重新排列的操作。它可能發生在編譯階段&#xff08;編譯器優化&#xff09;或CPU運行階段&#xff08;處理器優化&#xff09;。 舉個栗子…

嵌入式八股C語言---面向對象篇

面向對象與面向過程 面向過程 就是把整個業務邏輯分成多個步驟,每步或每一個功能都可以使用一個函數來實現面向對象 對象是類的實例化,此時一個類就內部有屬性和相應的方法 封裝 在C語言里實現封裝就是實現一個結構體,里面包括的成員變量和函數指針,然后在構造函數中,為結構體…

Distilling the Knowledge in a Neural Network知識蒸餾

一.知識蒸餾的定義 1. 量化VS蒸餾 量化&#xff1a;減小精度 例如參數float32—>float16蒸餾&#xff1a;Student model模仿Teacher model,在保持較高性能的同時&#xff0c;減少模型大小和計算復雜度的技術。 二.知識蒸餾步驟 1.教師模型訓練: 訓練一個大型且復雜的神…