模型參數、模型存儲精度、參數與顯存

模型參數、模型存儲精度、參數與顯存

pingmian/2025/6/24 19:04:44/文章來源:https://blog.csdn.net/Mr_dimple/article/details/148569080

模型參數量衡量單位

M：百萬（Million）

B：十億（Billion）

$1 B = 1000 M$

參數存儲精度

模型參數是固定的，但是一個參數所表示多少字節不一定，需要看這個參數以什么樣的精度去存儲。

單精度浮點數（FP32）：每個參數占用4字節（32位），提供較高的數值精度。
半精度浮點數（FP16）：每個參數占用2字節（16位），可以節省存儲空間和計算資源，但精度有所降低。
8位整數（INT8）：每個參數占用1字節（8位），主要用于量化模型，進一步減少存儲和計算開銷，但精度顯著降低。
雙精度浮點數（FP64）：每個參數占用8字節（64位），提供最高精度，但存儲和計算成本也最高。

參數所占顯存

參數顯存 = 參數數量 × 每個參數的字節數(B)

這里的 B 指的是字節

總顯存 = 參數顯存 + 激活值顯存 + 梯度顯存 + 優化器狀態顯存

在使用 checkpoint 進行推理的時候，主要計算參數顯存。

舉例：

一個 7b 參數的模型，參數存儲精度為 float16，那么：

總參數個數： $7 * 10^9$
一個參數所占字節數： $16/8 = 2 (B)$
參數所占總字節數，即參數顯存： $7 * 10^9 * 2 = 14*10^9(B)= 14*10^9 / 1024 / 1024 / 1024 ≈ 14(G)$

簡單來看，如果是float16，參數顯存就是 參數量*2；如果是 float32，參數顯存就是 參數量*4；如果是int8，參數顯存就是 參數量*1。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/84292.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/84292.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/84292.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

EurekaServer 工作原理

EurekaServer 工作原理

一、核心工作流程二、核心組件解析 1. 自動配置引擎入口：EnableEurekaServer 引入 EurekaServerMarkerConfiguration，創建標記Bean Marker觸發條件：EurekaServerAutoConfiguration 檢測到 Marker 存在時激活關鍵Bean初始化： …

閱讀更多...

Playwright 與 Selenium：自動化測試的兩大主流工具對比

Playwright 與 Selenium：自動化測試的兩大主流工具對比

《Playwright 與 Selenium：自動化測試的兩大主流工具對比》 *Playwright 和 Selenium 是自動化測試領域的兩大主流工具，二者在架構設計、功能特性和適用場景上存在顯著差異，以下是核心對比： 一、架構與設計理念維度Playwright…

閱讀更多...

網絡編程（Modbus進階）

網絡編程（Modbus進階）

思維導圖 Modbus RTU（先學一點理論） 概念 Modbus RTU 是工業自動化領域最廣泛應用的串行通信協議，由 Modicon 公司（現施耐德電氣）于 1979 年推出。它以高效率、強健性、易實現的特點成為工業控制系統的通信標準。包…

閱讀更多...

R語言速釋制劑QBD解決方案之二

R語言速釋制劑QBD解決方案之二

影響含量均一性的顯著因子（%RSD） 數據分析表明含量均一性的彎曲性不顯著。如半正態圖（圖12）所示，影響含量均一性的顯著因子為A（原料藥粒徑）和C（MCC/Lactose）。 mod2 <…

閱讀更多...

大模型原理、架構與落地

大模型原理、架構與落地

近年來，大模型（Large Language Models，LLMs）在人工智能領域迅猛發展，從GPT-3到GPT-4、Claude、Gemini、文心一言、GLM等模型相繼發布，大模型已逐漸走出實驗室，邁向產業落地。本文將從技術原理、…

閱讀更多...

WWDC 2025 macOS 26有哪些更新點

WWDC 2025 macOS 26有哪些更新點

在2025年6月10日凌晨結束的WWDC 2025發布會中，蘋果正式發布了全新的macOS 26，并給其命名為Tahoe。以下為macOS相關的主要內容： 命名方式改變蘋果正式將各大系統的版本號改為對應年份，讓命名方式更直觀好記，macOS 2…

閱讀更多...

AI+預測3D新模型百十個定位預測+膽碼預測+去和尾2025年6月10日第104彈

AI+預測3D新模型百十個定位預測+膽碼預測+去和尾2025年6月10日第104彈

從今天開始，咱們還是暫時基于舊的模型進行預測，好了，廢話不多說，按照老辦法，重點8-9碼定位，配合三膽下1或下2，殺1-2個和尾，再殺4-5個和值，可以做到100-300注左右。 (1)定…

閱讀更多...

.NET 8集成阿里云短信服務完全指南【短信接口】

.NET 8集成阿里云短信服務完全指南【短信接口】

文章目錄前言一、準備工作1.1 阿里云賬號準備1.2 .NET 8項目創建二、集成阿里云短信SDK2.1 安裝NuGet包2.2 配置阿里云短信參數2.3 創建配置類三、實現短信發送服務3.1 創建短信服務接口3.2 實現短信服務3.3 注冊服務四、創建控制器五、測試與優化5.1 單元測試5.2 性能優化…

閱讀更多...

解決HuggingFace不能git clone的問題

解決HuggingFace不能git clone的問題

今天在從HuggingFace上clone項目的時候，一直出現超時問題，查了很多資料沒有解決，后來向mentor請教了一下，可以通過鏡像的方法解決這個問題，所以把方法放上來，希望對大家有幫助。 HuggingFace的服務器在國外…

閱讀更多...

Zookeeper 集群部署與故障轉移

Zookeeper 集群部署與故障轉移

Zookeeper 介紹 Zookeeper 是一個開源的分布式協調服務，由Apache基金會維護，專為分布式應用提供高可用、強一致性的核心基礎能力。它通過簡單的樹形命名空間（稱為ZNode樹）存儲數據節點（ZNode），…

閱讀更多...

簡單聊下阿里云DNS劫持事件

簡單聊下阿里云DNS劫持事件

阿里云域名被DNS劫持事件事件總結根據ICANN規則，域名注冊商（Verisign）認定aliyuncs.com域名下的部分網站被用于非法活動（如傳播惡意軟件）；頂級域名DNS服務器將aliyuncs.com域名的DNS記錄統一解析到shado…

閱讀更多...

服務器出現故障怎么辦？快速排查與解決方法

服務器出現故障怎么辦？快速排查與解決方法

服務器故障的常見原因分析硬件故障：內存、硬盤、網絡設備故障。軟件故障：操作系統、應用程序、數據庫異常。網絡攻擊（如DDoS攻擊）造成資源耗盡。快速排查故障的步驟檢查監控系統報警日志。查看系統資源使用情況&#x…

閱讀更多...

Claude vs ChatGPT vs Gemini：功能對比、使用體驗、適合人群

Claude vs ChatGPT vs Gemini：功能對比、使用體驗、適合人群

隨著AI應用全面進入生產力場景，市面上的主流AI對話工具也進入“三國殺”時代： Claude（Anthropic）：新銳崛起，語言邏輯驚艷，Opus 模型被稱為 GPT-4 殺手ChatGPT（OpenAI）&a…

閱讀更多...

Git 使用大全：從入門到精通

Git 使用大全：從入門到精通

Git 是目前最流行的分布式版本控制系統，被廣泛應用于軟件開發中。本文將全面介紹 Git 的各種功能和使用方法，包含大量代碼示例和實踐建議。文章目錄 Git 基礎概念版本控制系統Git 的特點Git 的三個區域Git 文件狀態 Git 安裝與配置安裝 GitLinuxmacOSWi…

閱讀更多...

SpringBoot 框架第 1 次接口調用慢

SpringBoot 框架第 1 次接口調用慢

文章目錄背景分析思路 1：DeepSeek 分析思路 2：日志分析思路 3：Arthas 分析下載 Arthas啟動 Arthastrace 調用耗時分析Controller 調用耗時Service 調用分析ServiceImpl 耗時分析IService 耗時分析BaseMapper 耗時分析debug 執行鏈路MyBatisMapperProxy 解讀解決思路 1：預熱…

閱讀更多...

數據分析Agent構建

數據分析Agent構建

數據分析agent構建代碼資料來源于 Streamline-Analyst，旨在通過該倉庫上的代碼了解如何使用大語言模型構建數據分析工具； 個人倉庫：Data-Analysis-Agent-Tutorial 不同的在于 Data-Analysis-Agent-Tutorial 是在 Streamline-Analyst 基礎…

閱讀更多...

Java后端檢查空條件查詢

Java后端檢查空條件查詢

通過拋出運行異常：throw new RuntimeException("請輸入查詢條件！");BranchWarehouseServiceImpl.java // 查詢試劑交易（入庫/出庫）記錄Overridepublic List<BranchWarehouseTransactions> queryForReagent(Branch…

閱讀更多...

6??Go 語言中的哈希、加密與序列化：通往區塊鏈世界的鑰匙

6??Go 語言中的哈希、加密與序列化：通往區塊鏈世界的鑰匙

Go 語言中的哈希、加密與序列化：通往區塊鏈世界的鑰匙一、前言：離區塊鏈還有多遠？區塊鏈聽起來可能遙不可及，似乎是只有密碼學專家和資深工程師才能涉足的領域。但事實上，構建一個區塊鏈的核心并不復雜，尤其當你已經掌握了一門系統編程語言，比如 Go。要真正理解區…

閱讀更多...

python爬蟲——氣象數據爬取

python爬蟲——氣象數據爬取

一、導入庫與全局配置 python 運行 import json import datetime import time import requests from sqlalchemy import create_engine import csv import pandas as pd作用： 引入數據解析、網絡請求、時間處理、數據庫操作等所需庫。requests：發送 …

閱讀更多...

Python爬蟲（三）：BeautifulSoup庫

Python爬蟲（三）：BeautifulSoup庫

1. BeautifulSoup是什么？ BeautifulSoup 是一個 Python 庫，專門用來解析 HTML 或 XML 文件，方便我們提取數據。它能把網頁源代碼轉換成樹形結構，讓我們可以輕松查找、修改內容，并自動處理編碼問題（如 Unic…

閱讀更多...

最新文章