【大模型】大模型分類

大模型(Large Models)通常指參數量巨大、計算能力強大的機器學習模型,尤其在自然語言處理(NLP)、計算機視覺(CV)等領域表現突出。以下是大模型的常見分類方式:

1.?按應用領域分類

  • 自然語言處理(NLP)模型
    如GPT-3、BERT、T5等,主要用于文本生成、翻譯、問答等任務。
  • 計算機視覺(CV)模型
    如ResNet、EfficientNet、Vision Transformer (ViT)等,用于圖像分類、目標檢測等任務。
  • 多模態模型
    如CLIP、DALL·E等,能夠同時處理文本和圖像等多模態數據。
  • 語音模型
    如WaveNet、Whisper等,用于語音識別、合成等任務。
  • 強化學習模型
    如AlphaGo、AlphaZero等,用于游戲、機器人控制等領域。

2.?按模型架構分類

  • Transformer 模型
    如GPT、BERT、T5等,基于Transformer架構,廣泛應用于NLP。
  • 卷積神經網絡(CNN)模型
    如ResNet、Inception等,主要用于圖像處理。
  • 循環神經網絡(RNN)模型
    如LSTM、GRU等,適用于序列數據處理。
  • 生成對抗網絡(GAN)模型
    如StyleGAN、BigGAN等,用于圖像生成和編輯。
  • 圖神經網絡(GNN)模型
    如GCN、GAT等,用于圖結構數據處理。

3.?按模型規模分類

  • 小型模型
    參數量較少(如數百萬到數億),適合移動設備或實時應用。
  • 中型模型
    參數量在數十億左右,適合一般企業應用。
  • 大型模型
    參數量達數百億甚至千億(如GPT-3、PaLM),適合復雜任務。
  • 超大規模模型
    參數量超過千億(如GPT-4、Megatron-Turing NLG),需大量計算資源。

4.?按訓練方式分類

  • 預訓練模型
    如BERT、GPT等,通過大規模數據預訓練,可微調以適應特定任務。
  • 微調模型
    在預訓練基礎上,針對特定任務進行微調。
  • 端到端模型
    直接從輸入到輸出進行訓練,無需預訓練。

5.?按開源與閉源分類

  • 開源模型
    如BERT、GPT-2等,代碼和權重公開,可自由使用和修改。
  • 閉源模型
    如GPT-3、GPT-4等,僅通過API提供,無法訪問內部細節。

6.?按模型功能分類

  • 生成模型
    如GPT、DALL·E等,用于生成文本、圖像等內容。
  • 判別模型
    如BERT、ResNet等,用于分類、檢測等任務。
  • 多任務模型
    如T5、UniLM等,能夠同時處理多種任務。

7.?按模型部署方式分類

  • 云端模型
    如GPT-3、PaLM等,部署在云端,通過API調用。
  • 邊緣模型
    如MobileNet、TinyBERT等,部署在邊緣設備上,適合低延遲場景。

8.?按模型優化目標分類

  • 通用模型
    如GPT、BERT等,適用于多種任務。
  • 專用模型
    如AlphaFold(蛋白質結構預測)、Codex(代碼生成)等,針對特定領域優化。

這些分類方式有助于更好地理解大模型的特點和應用場景。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/71627.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/71627.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/71627.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

centos中使用svn整理

centos中使用svn整理 1. 安裝 SVN 客戶端2. 常見 SVN 用法及示例2.1 創建 SVN 倉庫2.2 檢出(Checkout)項目2.3 添加文件到版本控制2.4 提交(Commit)更改2.5 更新(Update)本地工作副本2.6 查看文件狀態2.7 查…

游戲元宇宙崛起:AI代理IP驅動虛擬世界“無限可能”?

在科技飛速發展的當下,游戲元宇宙正以一種前所未有的姿態崛起,它猶如一顆璀璨的新星,吸引著無數人的目光。而AI代理IP,正成為驅動這個虛擬世界展現“無限可能”的關鍵力量。 「快代理|11年專注企業級代理IP云服務 —…

基于Servlet + JSP 的物業管理系統

Javaweb物業管理系統|Java|Servlet | JavaWeb|web網站| 分管理員登錄,用戶登錄。 一、內容 項目源碼 配套文檔 環境部署教程 項目運行教程 二、技術介紹 技術應用: Servlet JavaBean CSS JSP 開發環…

Billing的patient balance的2個例子

Billing的patient balance的2個例子 第一個例子 下面是 0852醫院的00005641的計算: 主保險 Allowable: 78.81 Applied:61.79 CoInsurance:17.02 第二保險 Allowable: 15.76 Applied:15.76 我們在計算時是用主保險的Allowable: 78.81&#xff…

哪些培訓課程適合學習PostgreSQL中級認證知識?

PostgreSQL 中級工程師 PGCP 認證培訓:由重慶思 莊經驗豐富的講師鄭全老師授課。課程內容系統全面,涵蓋了 PostgreSQL 數據庫從基礎到高級的知識,包括數據庫的安裝、建庫、用戶與角色管理等基礎內容,也有性能調優、索引原理與應用…

計算機二級MS之PPT

聲明:跟著大貓和小黑學習隨便記下一些筆記供大家參考,二級考試之前將持續更新,希望大家二級都能輕輕松松過啦,過了二級的大神也可以在評論區留言給點建議,感謝大家!! 文章目錄 考題難點1cm25px…

第5章 使用OSSEC進行監控(網絡安全防御實戰--藍軍武器庫)

網絡安全防御實戰--藍軍武器庫是2020年出版的,已經過去3年時間了,最近利用閑暇時間,抓緊吸收,總的來說,第5章開始進入主機安全(HIDS)領域了,2022年的時候有幸做過終端安全一段時間&a…

Android 低功率藍牙之BluetoothGattCallback回調方法詳解

BluetoothGattCallback 是 Android 中用于處理藍牙低功耗(BLE)設備通信的核心回調類。它負責處理與 BLE 設備的連接、服務發現、數據讀寫等操作的結果。以下是對 BluetoothGattCallback 的詳細解析: 1. onConnectionStateChange 觸發時機&am…

DeepSeek group-limited expert routing和負載均衡

Ref https://github.com/deepseek-ai/DeepSeek-V3/blob/main/inference/model.py GitHub - deepseek-ai/EPLB: Expert Parallelism Load Balancer DeepSeek-V3 Technical Report DeepSeek的路由方法 class Gate(nn.Module):def __init__(self, args: ModelArgs):super().__…

Python的Pandas和matplotlib庫:讓數據可視化賊簡單

在數據爆炸的時代,數據可視化已成為數據分析的關鍵環節。Python 作為強大的編程語言,擁有眾多用于數據可視化的庫,而 pandas 庫在其中扮演著重要角色。它不僅能高效處理和分析數據,還具備強大的數據可視化功能,讓我們輕…

【代碼分享】基于IRM和RRT*的無人機路徑規劃方法詳解與Matlab實現

基于IRM和RRT*的無人機路徑規劃方法詳解與Matlab實現 1. IRM與RRT*的概述及優勢 IRM(Influence Region Map)通過建模障礙物的影響區域,量化環境中的安全風險,為RRT算法提供啟發式引導。RRT(Rapidly-exploring Random…

ubuntu打包 qt 程序,不用每次都用linuxdeployqt打包

用linuxdeployqt打包太麻煩,每次程序編譯都要用linuxdeployqt打包一次,而且每次都要很長時間,通過研究得出一個新的打包方法 1.用用linuxdeployqt得出依賴的庫文件(只要沒有增加新模塊,只要用一次就可以) …

Github 2025-03-06 Go開源項目日報 Top10

根據Github Trendings的統計,今日(2025-03-06統計)共有10個項目上榜。根據開發語言中項目的數量,匯總情況如下: 開發語言項目數量Go項目10Terraform:基礎設施即代碼的開源工具 創建周期:3626 天開發語言:Go協議類型:OtherStar數量:40393 個Fork數量:9397 次關注人數:…

redis 與 DB 的一致性 7 種策略

為什么要使用 redis 做緩存?封底估算為什么是單行數據的QPS,而不是總的? 什么時候使用DB,Redis,本地緩存 數據的分類一致性的方案1. 先清除Redis,再更新 DB2. 先更新DB,再清除 Redis使用場景: 3. 延遲刪除與延遲雙刪使用場景 4. 監聽 binlog 清除5. 雙寫使用場景: 6. 監聽bin…

使用 Elasticsearch 進行集成測試初始化??數據時的注意事項

作者:來自 Elastic piotrprz 在創建應該使用 Elasticsearch 進行搜索、數據聚合或 BM25/vector/search 的軟件時,創建至少少量的集成測試至關重要。雖然 “模擬索引” 看起來很誘人,因為測試甚至可以在幾分之一秒內運行,但它們實際…

【selenium工具操作web頁面中的下拉框元素 】

使用F12定位下拉框中的元素 使用F12定位下拉框中的元素 1、有一類元素不是直接顯示的頁面上的,而是需要點擊某些其他元素后才會顯示在頁面上,比如這里的下拉框。 2、這類元素會有一個特點:鼠標如果移開(沒在元素上),這些元素就會…

C++ set map 詳解

文章目錄 1. 容器2. set和multiset2.1 set2.1.1 構造函數2.1.2 insert和erase2.1.2.1 insert2.1.2.2 erase 2.1.3 查找和訪問2.1.3.1 set迭代器相關2.1.3.2 find && count2.1.3.3 范圍查找 2.2 multiset2.2.1 insert和erase2.2.2 find和count 2.3 set和multiset的在算法…

Unity網絡開發基礎 (2) 網絡協議基礎

本文章不作任何商業用途 僅作學習與交流 部分圖片來自Unity唐老師 目錄 1.虛擬模型 2.實際模型 TCP/IP 3.傳輸層協議 TCP/UDP TCP 協議詳解 1. 核心機制 2. 頭部格式(20 字節最小) UDP 協議詳解 1. 核心特點 2. 頭部格式(固定 8 字節…

HTML label 標簽使用

點擊 <label> 標簽通常會使與之關聯的表單控件獲得焦點或被激活。 通過正確使用 <label> 標簽&#xff0c;可以使表單更加友好和易于使用&#xff0c;同時提高整體的可訪問性。 基本用法 <label> 標簽通過 for 屬性與 id 為 username 的 <input> 元素…

JDBC、MyBatis 、MyBatis-Plus面試總結(一)

以下為你整理了一些 MyBatis 和 MyBatis-Plus 中 mapper.xml 相關的常見面試問題及答案&#xff1a; 基礎概念類 問題 1&#xff1a;什么是 mapper.xml 文件&#xff0c;它在 MyBatis 中有什么作用&#xff1f; 答案&#xff1a;mapper.xml 文件是 MyBatis 中用于定義 SQL 語…