【大模型】大模型分類

【大模型】大模型分類

pingmian/2025/9/18 13:23:02/文章來源:https://blog.csdn.net/IT_ORACLE/article/details/145934475

大模型（Large Models）通常指參數量巨大、計算能力強大的機器學習模型，尤其在自然語言處理（NLP）、計算機視覺（CV）等領域表現突出。以下是大模型的常見分類方式：

1.?按應用領域分類

自然語言處理（NLP）模型
如GPT-3、BERT、T5等，主要用于文本生成、翻譯、問答等任務。
計算機視覺（CV）模型
如ResNet、EfficientNet、Vision Transformer (ViT)等，用于圖像分類、目標檢測等任務。
多模態模型
如CLIP、DALL·E等，能夠同時處理文本和圖像等多模態數據。
語音模型
如WaveNet、Whisper等，用于語音識別、合成等任務。
強化學習模型
如AlphaGo、AlphaZero等，用于游戲、機器人控制等領域。

2.?按模型架構分類

Transformer 模型
如GPT、BERT、T5等，基于Transformer架構，廣泛應用于NLP。
卷積神經網絡（CNN）模型
如ResNet、Inception等，主要用于圖像處理。
循環神經網絡（RNN）模型
如LSTM、GRU等，適用于序列數據處理。
生成對抗網絡（GAN）模型
如StyleGAN、BigGAN等，用于圖像生成和編輯。
圖神經網絡（GNN）模型
如GCN、GAT等，用于圖結構數據處理。

3.?按模型規模分類

小型模型
參數量較少（如數百萬到數億），適合移動設備或實時應用。
中型模型
參數量在數十億左右，適合一般企業應用。
大型模型
參數量達數百億甚至千億（如GPT-3、PaLM），適合復雜任務。
超大規模模型
參數量超過千億（如GPT-4、Megatron-Turing NLG），需大量計算資源。

4.?按訓練方式分類

預訓練模型
如BERT、GPT等，通過大規模數據預訓練，可微調以適應特定任務。
微調模型
在預訓練基礎上，針對特定任務進行微調。
端到端模型
直接從輸入到輸出進行訓練，無需預訓練。

5.?按開源與閉源分類

開源模型
如BERT、GPT-2等，代碼和權重公開，可自由使用和修改。
閉源模型
如GPT-3、GPT-4等，僅通過API提供，無法訪問內部細節。

6.?按模型功能分類

生成模型
如GPT、DALL·E等，用于生成文本、圖像等內容。
判別模型
如BERT、ResNet等，用于分類、檢測等任務。
多任務模型
如T5、UniLM等，能夠同時處理多種任務。

7.?按模型部署方式分類

云端模型
如GPT-3、PaLM等，部署在云端，通過API調用。
邊緣模型
如MobileNet、TinyBERT等，部署在邊緣設備上，適合低延遲場景。

8.?按模型優化目標分類

通用模型
如GPT、BERT等，適用于多種任務。
專用模型
如AlphaFold（蛋白質結構預測）、Codex（代碼生成）等，針對特定領域優化。

這些分類方式有助于更好地理解大模型的特點和應用場景。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/71627.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/71627.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/71627.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

centos中使用svn整理

centos中使用svn整理

centos中使用svn整理 1. 安裝 SVN 客戶端2. 常見 SVN 用法及示例2.1 創建 SVN 倉庫2.2 檢出（Checkout）項目2.3 添加文件到版本控制2.4 提交（Commit）更改2.5 更新（Update）本地工作副本2.6 查看文件狀態2.7 查…

閱讀更多...

游戲元宇宙崛起：AI代理IP驅動虛擬世界“無限可能”?

游戲元宇宙崛起：AI代理IP驅動虛擬世界“無限可能”?

在科技飛速發展的當下，游戲元宇宙正以一種前所未有的姿態崛起，它猶如一顆璀璨的新星，吸引著無數人的目光。而AI代理IP，正成為驅動這個虛擬世界展現“無限可能”的關鍵力量。「快代理｜11年專注企業級代理IP云服務 —…

閱讀更多...

基于Servlet + JSP 的物業管理系統

基于Servlet + JSP 的物業管理系統

Javaweb物業管理系統｜Java｜Servlet | JavaWeb｜web網站｜ 分管理員登錄，用戶登錄。一、內容項目源碼配套文檔環境部署教程項目運行教程二、技術介紹技術應用： Servlet JavaBean CSS JSP 開發環…

閱讀更多...

Billing的patient balance的2個例子

Billing的patient balance的2個例子

Billing的patient balance的2個例子第一個例子下面是 0852醫院的00005641的計算： 主保險 Allowable: 78.81 Applied:61.79 CoInsurance:17.02 第二保險 Allowable: 15.76 Applied:15.76 我們在計算時是用主保險的Allowable: 78.81&#xff…

閱讀更多...

哪些培訓課程適合學習PostgreSQL中級認證知識？

哪些培訓課程適合學習PostgreSQL中級認證知識？

PostgreSQL 中級工程師 PGCP 認證培訓：由重慶思莊經驗豐富的講師鄭全老師授課。課程內容系統全面，涵蓋了 PostgreSQL 數據庫從基礎到高級的知識，包括數據庫的安裝、建庫、用戶與角色管理等基礎內容，也有性能調優、索引原理與應用…

閱讀更多...

計算機二級MS之PPT

計算機二級MS之PPT

聲明：跟著大貓和小黑學習隨便記下一些筆記供大家參考，二級考試之前將持續更新，希望大家二級都能輕輕松松過啦，過了二級的大神也可以在評論區留言給點建議，感謝大家！！ 文章目錄考題難點1cm25px…

閱讀更多...

第5章使用OSSEC進行監控(網絡安全防御實戰--藍軍武器庫)

第5章使用OSSEC進行監控(網絡安全防御實戰--藍軍武器庫)

網絡安全防御實戰--藍軍武器庫是2020年出版的，已經過去3年時間了，最近利用閑暇時間，抓緊吸收，總的來說，第5章開始進入主機安全（HIDS）領域了，2022年的時候有幸做過終端安全一段時間&a…

閱讀更多...

Android 低功率藍牙之BluetoothGattCallback回調方法詳解

Android 低功率藍牙之BluetoothGattCallback回調方法詳解

BluetoothGattCallback 是 Android 中用于處理藍牙低功耗（BLE）設備通信的核心回調類。它負責處理與 BLE 設備的連接、服務發現、數據讀寫等操作的結果。以下是對 BluetoothGattCallback 的詳細解析： 1. onConnectionStateChange 觸發時機&am…

閱讀更多...

DeepSeek group-limited expert routing和負載均衡

DeepSeek group-limited expert routing和負載均衡

Ref https://github.com/deepseek-ai/DeepSeek-V3/blob/main/inference/model.py GitHub - deepseek-ai/EPLB: Expert Parallelism Load Balancer DeepSeek-V3 Technical Report DeepSeek的路由方法 class Gate(nn.Module):def __init__(self, args: ModelArgs):super().__…

閱讀更多...

Python的Pandas和matplotlib庫：讓數據可視化賊簡單

Python的Pandas和matplotlib庫：讓數據可視化賊簡單

在數據爆炸的時代，數據可視化已成為數據分析的關鍵環節。Python 作為強大的編程語言，擁有眾多用于數據可視化的庫，而 pandas 庫在其中扮演著重要角色。它不僅能高效處理和分析數據，還具備強大的數據可視化功能，讓我們輕…

閱讀更多...

【代碼分享】基于IRM和RRT*的無人機路徑規劃方法詳解與Matlab實現

【代碼分享】基于IRM和RRT*的無人機路徑規劃方法詳解與Matlab實現

基于IRM和RRT*的無人機路徑規劃方法詳解與Matlab實現 1. IRM與RRT*的概述及優勢 IRM（Influence Region Map）通過建模障礙物的影響區域，量化環境中的安全風險，為RRT算法提供啟發式引導。RRT（Rapidly-exploring Random…

閱讀更多...

ubuntu打包 qt 程序，不用每次都用linuxdeployqt打包

ubuntu打包 qt 程序，不用每次都用linuxdeployqt打包

用linuxdeployqt打包太麻煩，每次程序編譯都要用linuxdeployqt打包一次，而且每次都要很長時間，通過研究得出一個新的打包方法 1.用用linuxdeployqt得出依賴的庫文件（只要沒有增加新模塊，只要用一次就可以） …

閱讀更多...

Github 2025-03-06 Go開源項目日報 Top10

Github 2025-03-06 Go開源項目日報 Top10

根據Github Trendings的統計，今日(2025-03-06統計)共有10個項目上榜。根據開發語言中項目的數量，匯總情況如下：開發語言項目數量Go項目10Terraform：基礎設施即代碼的開源工具創建周期：3626 天開發語言：Go協議類型：OtherStar數量：40393 個Fork數量：9397 次關注人數：…

閱讀更多...

redis 與 DB 的一致性 7 種策略

redis 與 DB 的一致性 7 種策略

為什么要使用 redis 做緩存?封底估算為什么是單行數據的QPS,而不是總的? 什么時候使用DB,Redis,本地緩存數據的分類一致性的方案1. 先清除Redis,再更新 DB2. 先更新DB,再清除 Redis使用場景: 3. 延遲刪除與延遲雙刪使用場景 4. 監聽 binlog 清除5. 雙寫使用場景: 6. 監聽bin…

閱讀更多...

使用 Elasticsearch 進行集成測試初始化??數據時的注意事項

使用 Elasticsearch 進行集成測試初始化??數據時的注意事項

作者：來自 Elastic piotrprz 在創建應該使用 Elasticsearch 進行搜索、數據聚合或 BM25/vector/search 的軟件時，創建至少少量的集成測試至關重要。雖然 “模擬索引” 看起來很誘人，因為測試甚至可以在幾分之一秒內運行，但它們實際…

閱讀更多...

【selenium工具操作web頁面中的下拉框元素】

【selenium工具操作web頁面中的下拉框元素】

使用F12定位下拉框中的元素使用F12定位下拉框中的元素 1、有一類元素不是直接顯示的頁面上的，而是需要點擊某些其他元素后才會顯示在頁面上，比如這里的下拉框。 2、這類元素會有一個特點：鼠標如果移開(沒在元素上)，這些元素就會…

閱讀更多...

C++ set map 詳解

C++ set map 詳解

文章目錄 1. 容器2. set和multiset2.1 set2.1.1 構造函數2.1.2 insert和erase2.1.2.1 insert2.1.2.2 erase 2.1.3 查找和訪問2.1.3.1 set迭代器相關2.1.3.2 find && count2.1.3.3 范圍查找 2.2 multiset2.2.1 insert和erase2.2.2 find和count 2.3 set和multiset的在算法…

閱讀更多...

Unity網絡開發基礎 (2) 網絡協議基礎

Unity網絡開發基礎 (2) 網絡協議基礎

本文章不作任何商業用途僅作學習與交流部分圖片來自Unity唐老師目錄 1.虛擬模型 2.實際模型 TCP/IP 3.傳輸層協議 TCP/UDP TCP 協議詳解 1. 核心機制 2. 頭部格式（20 字節最小） UDP 協議詳解 1. 核心特點 2. 頭部格式（固定 8 字節…

閱讀更多...

HTML label 標簽使用

HTML label 標簽使用

點擊 <label> 標簽通常會使與之關聯的表單控件獲得焦點或被激活。通過正確使用 <label> 標簽，可以使表單更加友好和易于使用，同時提高整體的可訪問性。基本用法 <label> 標簽通過 for 屬性與 id 為 username 的 <input> 元素…

閱讀更多...

JDBC、MyBatis 、MyBatis-Plus面試總結（一）

JDBC、MyBatis 、MyBatis-Plus面試總結（一）

以下為你整理了一些 MyBatis 和 MyBatis-Plus 中 mapper.xml 相關的常見面試問題及答案： 基礎概念類問題 1：什么是 mapper.xml 文件，它在 MyBatis 中有什么作用？ 答案：mapper.xml 文件是 MyBatis 中用于定義 SQL 語…

閱讀更多...

最新文章