Transformer模型分布式并行通信量淺析

Transformer模型分布式并行通信量淺析

news/2025/6/27 23:20:23/文章來源:https://blog.csdn.net/qq_19716143/article/details/136436423

1.數據并行DP（樸素數據并行，Zero數據并行之后補充）

$O(h^2*l)$
每臺機器做完自己的梯度后需要做一次All reduce操作來累積梯度，故一個batch計算發送的數據量為每層梯度大小 $h^2$ 乘以層數 $l$

優點：運用簡單，效率高，計算和通訊之間可以做異步。

缺點：有時候單個GPU無法容納下整個大模型做訓練。

流水線并行PP（Gpipe）

$O (b ? s ? h ? l / k)$
每個pp層之間發送中間變量大小（和輸入x相同大小）為 $b ? s ? h$ ，乘以正向和反向一共要傳遞的次數 $2 ? (l / k ? 1)$ ，得到上述大致的數量級

優點：通訊量小，數據無關。

缺點：要保證模型能均勻切分，否則會影響性能。需要用到重計算，來支持更大的批量 $b$ ，從而保證流水能發揮作用。反傳之前需要等待所以微批量計算。

張量模型并行TMP

$O (b ? s ? h ? l)$
MLP層第一個W1縱向切，第二個W2橫向切能保證一個MLP只做一次All reduce操作通訊。同理attn根據頭數來切分投影層。兩者每次的發送數據大小和PP一樣都是 $O (b ? s ? h)$ ，不同是，TMP發送量和模型Transformer層數成線性關系。

優點：能切分很大的Transformer模型。

缺點：通訊量大，且通信一般只在節點內部的多卡通訊，不做跨節點通訊。頭數需要被GPU整除。

*一般而言 $b ? s$ 略大于 $h$ ， $k$ 是 $l$ 的1/10，故一般而言，通訊量TMP>DP>PP.在實際的工程中，一般TMP和PP都在節點內通訊，只有數據并行會做跨節點通訊。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/718744.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/718744.shtml
英文地址，請注明出處：http://en.pswp.cn/news/718744.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

【李沐論文精讀】Resnet精讀

【李沐論文精讀】Resnet精讀

論文地址：Deep Residual Learning for Image Recognition 參考：撐起計算機視覺半邊天的ResNet【論文精讀】、ResNet論文逐段精讀【論文精讀】、【李沐論文精讀系列】一、導論深度神經網絡的優點：可以加很多層把網絡變得特別深，…

閱讀更多...

力扣周賽387

力扣周賽387

第一題代碼 package Competition.The387Competitioin;public class Demo1 {public static void main(String[] args) {}public int[] resultArray(int[] nums) {int ans[]new int[nums.length];int arr1[]new int[nums.length];int arr2[]new int[nums.length];if(nums.leng…

閱讀更多...

Linux系統Docker部署RStudio Server

Linux系統Docker部署RStudio Server

文章目錄前言1. 安裝RStudio Server2. 本地訪問3. Linux 安裝cpolar4. 配置RStudio server公網訪問地址5. 公網遠程訪問RStudio6. 固定RStudio公網地址前言 RStudio Server 使你能夠在 Linux 服務器上運行你所熟悉和喜愛的 RStudio IDE，并通過 Web 瀏覽器進行訪問…

閱讀更多...

第二十四章：Docker 部署 SpringBoot

第二十四章：Docker 部署 SpringBoot

第二十四章：Docker SpringBoot 配置文件容器外加載部署 Docker version 25.0.3, build 4debf41 ,Docker Compose version v2.24.2容器運行后，若需修改配置文件，只需修改宿主機的application-prod.yml ，重啟容器即可。 Springboot 2.x 版本部署規劃服務器IP192.168.92…

閱讀更多...

4. 編寫app組件

4. 編寫app組件

1. 代碼 main.ts // 引入createApp用于創建應用 import {createApp} from "vue"// 引入App根組件 import App from ./App.vue createApp(App).mount(#app) App.vue <!-- vue文件可以寫三種標簽1. template標簽，寫html結構2. script 腳本標簽&…

閱讀更多...

判斷docker 鏡像啟動成功 shell腳本

判斷docker 鏡像啟動成功 shell腳本

要編寫一個Shell腳本來判斷Docker鏡像是否啟動成功，你可以使用docker ps命令來檢查容器是否在運行狀態。以下是一個簡單的Shell腳本示例，用于判斷Docker鏡像是否成功啟動： #!/bin/bash# 指定要檢查的容器名稱或ID CONTAINER_NAME"your_c…

閱讀更多...

風險評估是什么意思？與等保測評有什么區別？

風險評估是什么意思？與等保測評有什么區別？

最近看到不少小伙伴在問，風險評估是什么意思？與等保測評有什么區別？這里我們就來簡單聊聊。風險評估是什么意思？ 風險評估是指對某個特定領域或項目進行全面分析和評估，以確定可能存在的潛在風險和危害，并…

閱讀更多...

2023全球軟件開發大會-上海站：探索技術前沿，共筑未來軟件生態(附大會核心PPT下載)

2023全球軟件開發大會-上海站：探索技術前沿，共筑未來軟件生態(附大會核心PPT下載)

隨著信息技術的迅猛發展，全球軟件開發大會（QCon）已成為軟件行業最具影響力的年度盛會之一。2023年，QCon再次來到上海，匯聚了眾多業界精英、技術領袖和開發者，共同探討軟件開發的最新趨勢和實踐。一、大會…

閱讀更多...

服務器感染了.ma1x0勒索病毒，如何確保數據文件完整恢復？

服務器感染了.ma1x0勒索病毒，如何確保數據文件完整恢復？

引言： 網絡安全成為至關重要的議題。.ma1x0勒索病毒是當前網絡威脅中的一種惡意軟件，它的出現給用戶帶來了極大的困擾。然而，正如任何挑戰一樣，我們也有方法來面對并克服.ma1x0勒索病毒。本文將全面介紹這種病毒的特點&#xff0…

閱讀更多...

MB85RC鐵電 FRAM驅動（全志平臺linux）

MB85RC鐵電 FRAM驅動（全志平臺linux）

測試幾天發現一個bug，就是無法一次讀取32個字節的數據，1-31,33,128,512都試過了，唯獨無法讀取32個字節，驅動未報錯，但是讀取的都是0，找不到原因，估計應該是全志iic驅動的問題，暫時沒…

閱讀更多...

leetcode - 2095. Delete the Middle Node of a Linked List

leetcode - 2095. Delete the Middle Node of a Linked List

Description You are given the head of a linked list. Delete the middle node, and return the head of the modified linked list. The middle node of a linked list of size n is the ?n / 2?th node from the start using 0-based indexing, where ?x? denotes th…

閱讀更多...

python中的類與對象（3）

python中的類與對象（3）

目錄一. 類的多繼承二. 類的封裝三. 類的多態四. 類與對象綜合練習：校園管理系統一. 類的多繼承在（2）第四節中我們介紹了什么是類的繼承，在子類的括號里面寫入要繼承的父類名。上一節我們只在括號內寫了一個父類名&…

閱讀更多...

新手淘寶開店如何引流

新手淘寶開店如何引流

對于新手淘寶賣家來說，引流是開店過程中最為關鍵的一環。如何吸引潛在客戶進入店鋪，提高商品的曝光率和銷量，是每個新手賣家都面臨的挑戰。本文將為你提供新手淘寶開店的引流攻略，幫助你從零開始掌握實用的引流技巧。一、優化店…

閱讀更多...

C++的類型轉換

C++的類型轉換

1.C語言中的類型轉換在C語言中，如果賦值運算符左右兩側類型不同，或者形參與實參類型不匹配，或者返回值類型與接收返回值類型不一致時，就需要發生類型轉化，C語言中總共有兩種形式的類型轉換：隱式類型轉換和…

閱讀更多...

【機器人最短路徑規劃問題（柵格地圖）】基于模擬退火算法求解

【機器人最短路徑規劃問題（柵格地圖）】基于模擬退火算法求解

代碼獲取方式：QQ：491052175 或者私聊博主獲取基于模擬退火算法求解機器人最短路徑規劃問題（柵格地圖）的仿真結果仿真結果： 初始解的路徑規劃圖收斂曲線： 模擬退火算法求解的路徑規劃圖結論&#xff…

閱讀更多...

Ubuntu20安裝zabbix-agent2，對接zabbix 6.4

Ubuntu20安裝zabbix-agent2，對接zabbix 6.4

在Ubuntu 20.04 LTS上安裝Zabbix Agent 2并與Zabbix Server 6.4對接，請按照以下步驟操作： 更新系統： sudo apt update sudo apt upgrade 添加Zabbix官方倉庫： 首先，需要將Zabbix的官方存儲庫添加到你的系統中以獲取Za…

閱讀更多...

C#面：常用的異常類有哪些

C#面：常用的異常類有哪些

異常類是用于處理程序運行時出現的錯誤或異常情況的類。 C# 提供了一些內置的異常類，常用的包括： System.Exception：所有異常類的基類，可以用于捕獲所有類型的異常。System.SystemException：表示系統級別的異常&…

閱讀更多...

【了解SpringCloud Gateway微服務網關】

【了解SpringCloud Gateway微服務網關】

曾夢想執劍走天涯，我是程序猿【AK】目錄簡述概要知識圖譜什么是SpringCloudGateway功能特征應用場景核心概念配置文件工作原理路由謂詞工廠（內置的）[After 路由謂詞工廠](https://docs.spring.io/spring-cloud-gateway/docs/current/refere…

閱讀更多...

Mysql運維篇（七）部署MHA--完結

Mysql運維篇（七）部署MHA--完結

一路走來，所有遇到的人，幫助過我的、傷害過我的都是朋友，沒有一個是敵人。如有侵權，請留言，我及時刪除！ 一、MHA軟件構成 Manager工具包主要包括以下幾個工具： masterha_manger 啟…

閱讀更多...

【C++】多態深入分析

【C++】多態深入分析

目錄一，多態的原理 1，虛函數表與虛函數表指針 2，原理調用 3，動態綁定與靜態綁定二，抽象類三，單繼承和多繼承關系的虛函數表 1，單繼承中的虛函數表 2，多繼承中的虛函數表 …

閱讀更多...

最新文章