《大語言模型》學習筆記(一)

一、什么是大語言模型

大語言模型是指在海量無標注文本數據上進行預訓練得到的大型預訓練語言模型,例如GPT-3,PaLM和LLaMA。大語言模型(Large Language Model,LLM)是一種基于深度學習的自然語言處理模型,能夠理解和生成人類語言。它通過大量文本數據進行訓練,學習語言的統計規律和語義關系,從而完成各種語言任務,如文本生成、翻譯、問答、摘要等。

二、大語言模型的特點

  1. 具有較為豐富的世界知識。與傳統機器學習模型相比,大語言模型經過超大規模文本數據的預訓練后能夠學習到較為豐富的世界知識。
  2. 具有較強的通用任務解決能力。大語言模型主要通過預測下一個詞元的預訓練任務進行學習,雖然并沒有針對特定的下游任務進行優化,卻能夠建立遠強于傳統模型的通用任務求解能力。
  3. 具有較好的復雜任務推理能力。大語言模型在大規模文本數據預訓練后,能夠展現出比傳統模型更強的綜合推理能力。
  4. 具有較強的人類指令遵循能力。大語言模型建立了自然語言形式的統一任務解決模式:任務輸入與執行結果均通過自然語言進行表達。通過預訓練與微調兩個階段的學習,大語言模型具備了較好的人類指令遵循能力,能夠直接通過自然語言描述下達任務指令(又稱為“提示學習”)。
  5. 具有較好的人類對齊能力。目前廣泛采用的對齊方式是基于人類反饋的強化學習技術,通過強化學習使得模型進行正確行為的加強以及錯誤行為的規避,進而建立較好的人類對齊能力。目前很多線上部署的大語言模型應用,都能夠有效阻止典型的模型功能濫用行為,一定程度上規避了常見的使用風險。
  6. 具有可拓展的工具使用能力。大語言模型具有較為通用的任務求解形式,可以通過微調、上下文學習等方式掌握外部工具的使用,如搜索引擎與計算器,通過具有特殊功能的工具來加強大語言模型的能力。目前最先進的大語言模型如GPT-4等能夠支持多種工具的使用,從而極大地提升了模型的任務解決能力。

三、大語言模型關鍵技術概覽

  1. 規模擴展。早期的研究主要關注模型參數規模所帶來的性能優勢,最近的工作則是加大對于高質量數據的規模擴展。針對十億級別(如2B或7B)參數的模型使用超大規模的數據(如2T或3T詞元)進行訓練,仍然可能無法達到這些模型的最大數據容量。實現規模擴展的關鍵在于模型架構的可擴展性。Transformer模型的可擴展性非常強,對于硬件并行優化的支持也比較友好,特別適合大語言模型的研發,很多工作也在進一步針對其進行優化與改進。
  2. 數據工程。OpenAI于2019年就在GPT-2的論文中給出了當前大語言模型的技術路線圖:通過在海量文本上進行下一個詞預測的優化,使得模型能夠學習到豐富的語義知識信息,進而通過文本補全的方式解決各種下游任務。這種方式最大的好處是,極大地簡化了模型的設計與優化過程,使得模型訓練與使用都是基于自然語言生成的模式進行的。在這種通用的預訓練范式下,模型能力本質上是來源于所見過的訓練數據,因此數據工程就變得極為重要。目前來說,數據工程主要包括三個方面。首先,需要對于數據進行全面的采集,拓寬高質量的數據來源;其次,需要對于收集到的數據進行精細的清洗,盡量提升用于大模型訓練的數據質量;第三,需要設計有效的數據配比與數據課程,加強模型對于數據語義信息的利用效率。這三個方面的數據工程技術直接決定了最后大語言模型的性能水平。目前來說,針對英文的開源高質量數據集合比較豐富,相關的數據工程技術討論也相對較多,但是對于其他語言的研究關注度還有待進一步加強。
  3. 高效預訓練。由于參數規模巨大,需要使用大規模分布式訓練算法優化大語言模型的神經網絡參數。由于大語言模型的訓練需要耗費大量的算力資源,通常需要開展基于小模型的沙盒測試實驗,進而確定面向大模型的最終訓練策略。為此,GPT-4構建了一整套面向大模型的基礎訓練架構,可以使用較少的算力開銷來可靠地預測大模型的最終性能。
  4. 能力激發。現有的研究認為指令微調無法向大模型注入新的知識,而是訓練大模型學會利用自身所掌握的知識與信息進行任務的求解。在提示學習方面,需要設計合適的提示策略去誘導大語言模型生成正確的問題答案。為此,研究人員提出了多種高級提示策略,包括上下文學習、思維鏈提示等,通過構建特殊的提示模板或者表述形式來提升大語言模型對于復雜任務的求解能力。提示工程已經成為利用大語言模型能力的一個重要技術途徑。進一步,大語言模型還具有較好的規劃能力,能夠針對復雜任務生成逐步求解的解決方案,從而簡化通過單一步驟直接求解任務的難度,進一步提升模型在復雜任務上的表現。
  5. 人類對齊。在實踐應用中,需要保證大語言模型能夠較好地符合人類的價值觀。將人類偏好引入到大模型的對齊過程:首先訓練能夠區分模型輸出質量好壞的獎勵模型,進而使用強化學習算法來指導語言模型輸出行為的調整,讓大語言模型能夠生成符合人類預期的輸出。
  6. 工具使用。通過讓大語言模型學會使用各種工具的調用方式,進而利用合適的工具去實現特定的功能需求。為了能夠有效地使用外部工具,GPT系列模型通過插件機制來形成系統性的工具調用方式,這些插件可以類比為大語言模型的“眼睛和耳朵”,能夠有效擴展大語言模型的能力范圍。在技術路徑上,工具調用能力主要是通過指令微調以及提示學習兩種途徑實現,而未經歷過特殊訓練或者缺乏有效提示的大語言模型則很難有效利用候選工具。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/897862.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/897862.shtml
英文地址,請注明出處:http://en.pswp.cn/news/897862.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

電力行業中分布式能源管理(Distributed Energy Management System, DEMS)的實現

以下是電力行業中分布式能源管理(Distributed Energy Management System, DEMS)的實現方案,涵蓋系統架構、關鍵技術、核心功能及實施路徑,結合典型場景與代碼示例: 一、系統架構設計 采用云-邊-端三層架構,實現分布式能源的高效協同管理: 1. 終端層(感知層) 設備組…

實驗5 邏輯回歸

實驗5 邏輯回歸 【實驗目的】掌握邏輯回歸算法 【實驗內容】處理樣本,使用邏輯回歸算法進行參數估計,并畫出分類邊界 【實驗要求】寫明實驗步驟,必要時補充截圖 1、參照“2.1梯度下降法實現線性邏輯回歸.ipynb”和“2.2 sklearn實現線性邏輯…

思維訓練讓你更高、更強 |【邏輯思維能力】「刷題訓練筆記」假設法模式邏輯訓練題(1-5)

每日一刷 思維訓練讓你更高、更強! 題目1 誰在說謊,誰拿走了零錢? 姐姐上街買菜回來后,就隨手把手里的一些零錢放在了抽屜里,可是,等姐姐下午再去拿錢買菜的時候發現抽屜里的零錢沒有了,于是&…

【愚公系列】《高效使用DeepSeek》004-DeepSeek的產品形態和功能詳解

標題詳情作者簡介愚公搬代碼頭銜華為云特約編輯,華為云云享專家,華為開發者專家,華為產品云測專家,CSDN博客專家,CSDN商業化專家,阿里云專家博主,阿里云簽約作者,騰訊云優秀博主,騰訊云內容共創官,掘金優秀博主,亞馬遜技領云博主,51CTO博客專家等。近期榮譽2022年度…

用python代碼將excel中的數據批量寫入Json中的某個字段,生成新的Json文件

需求 需求: 1.將execl文件中的A列賦值給json中的TrackId,B列賦值給json中的OId 要求 execl的每一行,對應json中的每一個OId json 如下: {"List": [{"BatchNumber": "181-{{var}}",// "Bat…

【Python】dash-fastapi前后端搭建

概述 項目中需要快速搭建一個前后端系統,涉及到dash-fastapi架構的時候,對該架構的時候進行總結。本文主要總結的是對該架構的基本使用,后續再對該架構的項目源碼進行總結分析 此處實現一個小的demo,迷你任務管理器,…

IDEA中鏈接使用mysql數據庫

一、連接mysql 1. 打開idea,在右上角側邊欄有數據庫database插件,打開側邊欄點擊加號->數據源,可以看到支持很多數據庫,選擇mysql。 2. 首次使用需要下載驅動程序,不然連接數據庫會報錯。找到mysql,點擊…

程序編譯生成的文件

目錄 .i 文件 .s 文件 .o文件 總結 在 C 編程中,.i、.s和 .o 文件是編譯過程中生成的不同階段的文件,它們代表不同的含義: .i 文件 全稱 :預處理后的文件(Intermediate File)。 含義:.i文件…

[S32K]SPI

SpiShiftClockidleLevel: CLK空閑時電平(CPOL); SpiDataShifrEdge:數據移位邊沿(CPHA); SpiDataWidth: SpiTransferStart: MSB(高位起始),LSB(低位起始);; SpiHwUnit: 這是一個具體的硬件? SpiDataShiftE…

系統思考:客戶價值

“真正的市場競爭,不是比誰更能制造產品,而是比誰更能創造價值。” ——杰夫貝索斯 在組織輔導中,我經常問團隊一個問題:“我們的客戶是誰?”大多數人的第一反應是——“支付費用的就是客戶。” 這在過去的市場擴張階…

ArcGIS Pro 車牌分區數據處理與地圖制作全攻略

在大數據時代,地理信息系統(GIS)技術在各個領域都有著廣泛的應用,而 ArcGIS Pro 作為一款功能強大的 GIS 軟件,為數據處理和地圖制作提供了豐富的工具和便捷的操作流程。 車牌數據作為一種重要的地理空間數據&#xf…

OpenCV圖像加權函數:addWeighted

1 addWeighted函數 在OpenCV 里,addWeighted 函數的作用是對兩個圖像進行加權求和,常用于圖像融合、圖像過渡等場景。函數如下: cv2.addWeighted(src1, alpha, src2, beta, gamma[, dst[, dtype]])2 參數解釋 src1:第一個輸入圖…

Tcp網絡通信的基本流程梳理

先來一張經典的流程圖 接下介紹一下大概流程,各個函數的參數大家自己去了解加深一下印象 服務端流程 1.創建套接字:使用 socket 函數創建一個套接字,這個套接字后續會被用于監聽客戶端的連接請求。 需要注意的是,服務端一般有倆…

mysql學習-刪除數據(drop、truncate、delete)

1、概述 drop、truncate、delete都可以刪除mysql中的數據,但它們的作用范圍和操作方式有很大的不同。 2、詳細區別 2.1、drop 特點: 1、速度快 2、會刪除表數據,還會刪除表結構,包括與該表相關的所有數據,索引&…

編程自學指南:java程序設計開發,網絡編程基礎,TCP編程,UDP編程,HTTP客戶端開發

編程自學指南:java程序設計開發,網絡編程基礎 學習目標: 理解網絡協議(TCP/IP、UDP)的核心概念 掌握Socket編程實現客戶端與服務端通信 能夠通過多線程處理并發網絡請求 開發簡單的網絡應用(如聊天程序…

leecode797.所有可能的路徑

深度優先搜索 class Solution { private:vector<vector<int>> result;vector<int> temp;void allPathsSourceTarget(vector<vector<int>> &graph,int v){if(vgraph.size()-1)result.push_back(temp);else{for(auto& adjVertex:graph[v]…

第八節:紅黑樹(初階)

【本節要點】 紅黑樹概念紅黑樹性質紅黑樹結點定義紅黑樹結構紅黑樹插入操作的分析 一、紅黑樹的概念與性質 1.1 紅黑樹的概念 紅黑樹 &#xff0c;是一種 二叉搜索樹 &#xff0c;但 在每個結點上增加一個存儲位表示結點的顏色&#xff0c;可以是 Red和 Black 。 通過對 任何…

微信小程序threejs三維開發

微信小程序threejs開發 import * as THREE from three; const { performance, document, window, HTMLCanvasElement, requestAnimationFrame, cancelAnimationFrame, core, Event, Event0 } THREE .DHTML import Stats from three/examples/jsm/libs/stats.module.js; im…

jupyter無法轉換為PDF,HTMLnbconvert failed: Pandoc wasn‘t found.

無法轉為PDF 手動下載工具 https://github.com/jgm/pandoc/releases/tag/3.6.3 似乎跟我想的不大一樣&#xff0c;還有新的報錯 https://nbconvert.readthedocs.io/en/latest/install.html#installing-tex 不知道下的啥玩意兒 sudo apt-get install texlive-xetex texlive-fon…

關于PLC、電纜線材及氣缸選型的詳細教程

以下是關于PLC、電纜線材及氣缸選型的詳細教程&#xff0c;整合了多個專業來源的核心要點&#xff1a; 一、PLC選型要點 生產廠家選擇 日系PLC&#xff08;如三菱FX系列、歐姆龍CP1系列&#xff09;適合獨立設備或簡單控制系統&#xff0c;性價比高。歐美系PLC&#xff08;如西…