大模型應用:LLM基本原理及應用場景

在這里插入圖片描述

1.背景

23年以來,隨著OpenAI公司的ChatGPT橫空出世,大模型一詞開始火爆全球。國內外以OpenAI、Google、百度、阿里、字節等大廠為代表,相繼推出一系列大模型及其應用,涉及社交、問答、代碼助手等多個方面。
目前主流的大模型及產品:

  • OpenAI:GPT3.5、GTP4系列,以及Lora等文生圖模型,代表產品:ChatGPT
  • Google:Gemini
  • 百度:文心一言3.0、4.0系列,代表產品:文心一言、文心一格
  • 阿里:通義大模型,代表產品:通義千問
  • 百川:百川大模型
  • 騰訊:混元大模型
  • 字節:豆包大模型

大模型究竟是什么,和基礎的垂類模型/多模態模型有何差異?為什么可以基于大模型來構建一系列垂類應用,以及可以使用大模型構建什么應用?

2.LLM基本原理

大模型又被稱為大語言模型(Large Language Model)或大規模預訓練語言模型(Large Pretrained Language Model)。
對于小模型(垂類模型):每個小模型對打標數據集識別進行訓練,比如專注識別貓狗圖片的圖片模型、并在對應的數據集上評估,給出模型產物。小模型的特點是“專注”,每一個小模型訓練出來就是為了識別某類特定目標。
對于大模型來說,其需要具備大量的語料參數以及很好的理解能力,其訓練分為兩個階段:

  1. 一階段預訓練:在大量的文本語料數據集(待標數據)中進行訓練,提取特征。經過預訓練后的大模型具有大量參數和強大的語料理解能力,它能識別輸入的文本,并且預測出下一個最大概率的文本,一階段訓練后產出的大模型為基礎LLM。
  2. 二階段指令微調:由于一階段產出的基礎LLM只能做到從輸入的文本預測下一個最有可能的文本,比如輸入“中國的首都”,那么預測輸出為“中國”,但如果我們想讓大模型“思考”,如輸入“你知道中國的首都是北京嗎?”,那么大模型的預測輸出可能不符合預期。所以對于使用場景,需要對一階段基礎LLM進行微調,通過指令微調給定輸入,并且明確告訴LLM需要基于該輸入,得到什么樣的結果,讓LLM學習這個過程,已得到二階段的指令微調LLM。比如ChatGPT使用大模型的就是由GPT基礎LLM經過微調后得到的。
    在這里插入圖片描述

對于算法架構,LLM主要是采用了Transformer架構來增強大模型對語料的上下文理解能力,可以做到長序列理解及推理。

3.LLM應用場景

基礎LLM具有千億級別參數及語料,具有很好的文本理解能力,通過二階段指令微調可以讓基礎LLM在特定場景下做到更準確的輸出判斷,目前LLM應用場景十分廣泛,包括:

  1. 社交領域
    1. 智能對話
    2. 虛擬人
  2. 編程領域
    1. 代碼理解
    2. 潛在BUG掃描
    3. 代碼生成
  3. 風控領域
    1. 智能審核
    2. 風險判別
  4. 工業/醫學領域
    1. 系統檢修判斷
    2. 醫學輔助診斷
  5. 生成式創造
    1. 文生圖
    2. 文生視頻
    3. 圖片/視頻擴展

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/18284.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/18284.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/18284.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Echarts - 多個頁面內有N個 echarts 圖表,封裝組件 CommonEcharts 快捷實現

目錄 子組件父組件使用注意 option 文件效果展示相關數據處理&#xff08;代碼備份 - 可不看&#xff09;數據處理后頁面展示 子組件 CommonEcharts.vue <template><div><div v-for"id in domId" :id"id" :key"id" class"…

代碼隨想錄算法訓練營Day53 | 1143.最長公共子序列、1035.不相交的線、53. 最大子序和 | Python | 個人記錄向

本文目錄 1143.最長公共子序列做題看文章 1035.不相交的線做題看文章 53. 最大子序和做題看文章 以往忽略的知識點小結個人體會 1143.最長公共子序列 代碼隨想錄&#xff1a;1143.最長公共子序列 Leetcode&#xff1a;1143.最長公共子序列 做題 無思路。 看文章 dp[i][j]&…

基于事件的架構工作機制和相關產品

基于事件的架構 基于事件的架構可否這樣理解&#xff0c;每個事件相當于傳統API的一次函數調用請求&#xff0c;比如Add(123,456)。區別在于&#xff0c;基于事件的架構只是把這個請求發出&#xff0c;并不急于得到結果&#xff0c;而是等合適的子系統處理完這個請求&#xff…

go select

select 是與 switch 相似的控制結構&#xff0c;與 switch 不同的是&#xff0c;select 中雖然也有多個 case&#xff0c;但是這些 case 中的表達式必須都是 channel 的收發操作。 select 能夠讓 goroutine 同時等待多個 channel 可讀或者可寫&#xff0c;在多個 channel 狀態改…

使用awk對nginx access.log進行統計分析

nginx可以配置訪問日志&#xff0c;如果我們要對日志文件進行統計分析&#xff0c;在linux環境下可以借助awk命令完成。 日志格式配置如下所示&#xff1a; log_format access_json {"timestamp":"$time_iso8601","host":"$server_addr&qu…

Flutter 中的 AnimatedOpacity 小部件:全面指南

Flutter 中的 AnimatedOpacity 小部件&#xff1a;全面指南 在Flutter中&#xff0c;動畫是一種為用戶提供視覺反饋和增強用戶體驗的強大工具。AnimatedOpacity是Flutter動畫庫中的一個組件&#xff0c;它允許你通過改變一個組件的透明度來創建淡入和淡出效果。本文將詳細介紹…

章十五、Maven —— Maven 簡介、Maven 開發環境搭建、命令、打包案例

一、 Maven 簡介 Maven 是 Apache 軟件基金會的一個開源項目&#xff0c;是一個優秀的項目構建工具&#xff0c;它用來幫助開發者管理項目中的 jar&#xff0c;以及 jar 之間的依賴關系&#xff08;在A.jar文件中用到了B.jar&#xff09;、完成項目的編譯&#xff08;.java -&g…

Compose Button移除水波紋效果

一、背景 在使用Compose實現Button按鈕時&#xff0c;設計要求移除按鈕的水波紋效果&#xff0c;只保留按壓效果&#xff0c;經查Compose1.4.3版本中&#xff0c;并沒有直接移除水波紋的能力 二、遇到問題 經過多次嘗試&#xff0c;使用Compose的Button組件始終無法實現目標效…

html通過數據改變,圖片跟著改變

改變前 改變后 通過數據來控制樣式展示 <template><div>通過num控制圖標是否更改{{num}}<div class"box"><!-- 如果num大于1則是另一種&#xff0c;樣式&#xff0c;如果小時1&#xff0c;則是另一種樣式 --><div class"item&qu…

android怎么告訴系統不要回收

在Android中&#xff0c;如果你想告訴系統不要回收你的應用程序&#xff0c;可以通過設置Activity的屬性來實現。你可以設置android:configChanges屬性&#xff0c;指定在哪些配置更改時不重新創建Activity。 例如&#xff0c;如果你想指示系統在屏幕方向更改時不要重新創建Ac…

又是一知識點

1.說一下什么是mvvm模式 Model代表數據模型&#xff0c;數據和業務邏輯都在Model層中定義&#xff1b;View代表UI視圖&#xff0c;負責數據的展示&#xff1b;ViewModel負責監聽Model中數據的改變并且控制視圖的更新&#xff0c;處理用戶交互操作&#xff1b; View 的變化會自…

小阿軒yx-Shell 編程之循環語句與函數

小阿軒yx-Shell 編程之循環語句與函數 for 循環語句 可以很好地解決順序編寫異常煩瑣、困難重重的全部代碼 &#xff08;&#xff09;{}&#xff1a;里邊寫的都是命令 &#xff09;&#xff1a;不能嵌套 $&#xff08;&#xff09;&#xff1a;可以嵌套&#xff0c;適合更…

day42 62.不同路徑 63. 不同路徑 II

62.不同路徑 思路 機器人從(0 , 0) 位置出發&#xff0c;到(m - 1, n - 1)終點。 按照動規五部曲來分析&#xff1a; 1.確定dp數組&#xff08;dp table&#xff09;以及下標的含義 dp[i][j] &#xff1a;表示從&#xff08;0 &#xff0c;0&#xff09;出發&#xff0c;…

2-Django項目進階--繼續學生管理系統

目錄 項目框架: urls.py views.py modules.py class_data.html add_and_modify.html add_stu.html 筆記: 繼承語法 模板繼承總結&#xff1a; 班級添加 add_and_modify.html 修改添加公用一個頁面即可 views.py 班級修改 views.py url.py 班級刪除 views.py…

boost asio異步服務器(2)實現偽閉包延長連接生命周期

閉包 在函數內部實現一個子函數&#xff0c;子函數的作用域內能訪問外部函數的局部變量。閉包就是能夠讀取其他函數內部變量。但是由于閉包會使得函數中的變量都被保存在內存中&#xff0c;內存消耗很大&#xff0c;所以不能濫用閉包&#xff0c;否則會造成程的性能問題&#x…

構造器--5.28

不用一個個屬性賦值的方法&#xff1a; 知道了類的創建與使用&#xff0c;但是每次賦值都是一個個調用&#xff0c;我們可以用構造器使得方法簡單一點&#xff0c;不用一個個調用屬性賦值&#xff0c;直接傳參就OK了&#xff1b; 點擊類名然后ctrl可以查看構造器 public yanxi…

C++完成特色旅游管理信息系統

背景&#xff1a; 繼C完成淄博燒烤節管理系統后&#xff0c;我們來到了特色旅游管理信息系統的代碼編寫&#xff0c;歷史鏈接點下方。 C完成淄博燒烤節管理系統_淄博燒烤總賬管理系統的-CSDN博客 問題描述&#xff1a; 為了更好的管理各個服務小組&#xff0c;開發相應的管…

民國漫畫雜志《時代漫畫》第30期.PDF

時代漫畫30.PDF: https://url03.ctfile.com/f/1779803-1248635414-87c8c8?p9586 (訪問密碼: 9586) 《時代漫畫》的雜志在1934年誕生了&#xff0c;截止1937年6月戰爭來臨被迫停刊共發行了39期。 ps: 資源來源網絡!

webpack打包配置項

webpack打包配置項 在config.js 中 module.exports {publicPath: process.env.NODE_ENV production ? / : /, //靜態資源目錄outputDir: dist, //打包名稱assetsDir: static,//靜態資源&#xff0c;目錄devServer: {port: port,open: false,overlay: {warnings: false,erro…

SpringBoot自動裝配源碼

自動裝配&#xff1a; 實際上就是如何將Bean自動化裝載到IOC容器中管理&#xff0c;Springboot 的自動裝配時通過SPI 的方式來實現的 SPI&#xff1a;SpringBoot 定義的一套接口規范&#xff0c;這套規范規定&#xff1a;Springboot 在啟動時會掃描外部引用 jar 包中的META-IN…