Megatron-lm、DeepSpeed

Megatron-lm、DeepSpeed

diannao/2025/9/15 15:25:28/文章來源:https://blog.csdn.net/jinselizhi/article/details/138915167

1、為了訓練更多的數據、更大的模型，提出了并行訓練框架。

2、并行的方式：數據并行、模型并行（張量并行、流水線并行）。

3、Megatron-LM 綜合應用了數據并行（Data Parallelism），張量并行（Tensor Parallelism）和流水線并行（Pipeline Parallelism）。

4、DeepSpeed的核心是ZeRO(Zero Redundancy Optimizer)：顯存優化的數據并行(data parallelism, DP)方案。

ZeRO將模型訓練階段，每張卡中顯存內容分為兩類：模型（參數、梯度、Adam狀態）、剩余（激活值、臨時緩沖區、顯存碎片）。

猛猿-大模型預訓練系列

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/13054.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/13054.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/13054.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

內網安全工具之ADExplorer的使用

內網安全工具之ADExplorer的使用

ADExplorer是域內一款信息查詢工具，它是獨立的可執行文件，無需安裝。它能夠列出域組織架構、用戶賬號、計算機賬號登，可以幫助尋找特權用戶和數據庫服務器等敏感目標。下載地址：http://live.sysinternals.com/ 連接下載了ADE…

閱讀更多...

第十四屆藍橋杯大賽軟件賽國賽C/C++ 大學 B 組拼數字

第十四屆藍橋杯大賽軟件賽國賽C/C++ 大學 B 組拼數字

//bfs只能過40%。 #include<bits/stdc.h> using namespace std; #define int long long int a,b,c,dp[2028]; struct s {int x,y,z;string m; }; map<vector<int>,int>k; signed main() {ios::sync_with_stdio(false);cin.tie(0),cout.tie(0);cin>>a…

閱讀更多...

Java入門基礎學習筆記24——While循環和do-while循環

Java入門基礎學習筆記24——While循環和do-while循環

1、While循環： 例1： package cn.ensource.loop;public class WhileDemo3 {public static void main(String[] args) {// 目標：掌握while循環的書寫格式，以及理解其執行流程// 需求：打印多行Hello Worldint i 0;while…

閱讀更多...

EFCore_創建項目

EFCore_創建項目

添加依賴 Microsoft.EntityFrameworkCore Microsoft.EntityFrameworkCore.Tools(Migration工具) 根據使用的DB添加對應依賴： SQL Server：Microsoft.EntityFrameworkCore.SqlServer 添加該依賴時可不添加Microsoft.EntityFrameworkCore，該依…

閱讀更多...

電工能混到這份上

電工能混到這份上

最近看到某電工師傅發了一篇帖子，大致內容是他在處理一個簡單故障的時候居然花了很長的時間。我們一起來看看他遇到的是什么故障吧! plc 控制的一臺設備，行走部分靠 2 個腳踏開關控制（內部開關量控制方向，電位器控制速度&#xff…

閱讀更多...

Java：使用BigDecimal、NumberFormat和DecimalFormat保留小數

Java：使用BigDecimal、NumberFormat和DecimalFormat保留小數

一、代碼和調試結果 1.1 BigDecimal ![在這里插入圖片描述](https://img-blog.csdnimg.cn/direct/fa36749de8124266a730817710fdf737.png) 1.2 DecimalFormat 1.3 NumberFormat 二、原代碼 BigDecimalUtil.java 代碼 package utils;import java.math.BigDecimal; import jav…

閱讀更多...

前端模塊導入導出方式

前端模塊導入導出方式

不同的導出方式和相應的導入方式，可以提煉成 3 種類型：name、default 和 list。以下是使用示例： // Name Export | Name Import // 一個“命名”的導出 export const name value import { name } from ...? 錯誤示例： export…

閱讀更多...

Linux平臺和Windows平臺互傳文件

Linux平臺和Windows平臺互傳文件

rz和sz的出發對象都是從Linux出發的，例如sz發送（Send）從Linux->發送到Windows。 rz 從Windows文件發送到Linux中先創立一個新文本文件之后將hello Windows輸入到該文本文件中在顯示器上顯示里面是否有hello Windows內容 sz發送Lin…

閱讀更多...

Flutter 中的 PageStorage 小部件：全面指南

Flutter 中的 PageStorage 小部件：全面指南

Flutter 中的 PageStorage 小部件：全面指南在Flutter中，PageStorage小部件提供了一種方法來保存和恢復頁面間的信息，這對于具有多個頁面且需要在這些頁面之間共享狀態的應用程序非常有用。本文將詳細介紹PageStorage的用途、如何使用它以及…

閱讀更多...

Microsoft Azure AI語音服務

Microsoft Azure AI語音服務

一：文字轉語音SDK安裝安裝語音 SDK - Azure AI services | Microsoft Learn 二：基于文本轉語音Rest API 文本轉語音 API 參考 (REST) - 語音服務 - Azure AI services | Microsoft Learn 三：基于文本合成語音如何基于文本合成語音 - 語…

閱讀更多...

Retrying，一個神奇優雅的 Python 庫

Retrying，一個神奇優雅的 Python 庫

大家好！我是愛摸魚的小鴻，關注我，收看每期的編程干貨。一個簡單的庫，也許能夠開啟我們的智慧之門， 一個普通的方法，也許能在危急時刻挽救我們于水深火熱， 一個新穎的思維方式，也許能…

閱讀更多...

非成對意象翻譯中的內容制約范式再思考

非成對意象翻譯中的內容制約范式再思考

Rethinking the Paradigm of Content Constraints in Unpaired Image-to-Image Translation 非成對意象翻譯中的內容制約范式再思考 Xiuding Cai1 2, Yaoyao Zhu1 2, Dong Miao1 2, Linjie Fu1 2, Yu Yao1 2 蔡秀定 1 2 、朱瑤瑤 1 2 、苗東 1 2 、付林杰 1 2 、余瑤 1 2 Corre…

閱讀更多...

遙感數據集制作（Potsdam數據集為例）：TIF圖像轉JPG，TIF標簽轉PNG，圖像重疊裁剪

遙感數據集制作（Potsdam數據集為例）：TIF圖像轉JPG，TIF標簽轉PNG，圖像重疊裁剪

文章目錄 TIF圖像轉JPGTIF標簽轉PNG圖像重疊裁剪圖像重命名數據集轉COCO格式數據集轉VOC格式遙感圖像不同于一般的自然圖像，由于波段數量、圖像位深度等原因，TIF圖像數據不能使用簡單的格式轉換方法。本文以Potsdam數據集為例，制作能夠直接用…

閱讀更多...

Linux安裝配置CGAL,OpenCV和Gurobi記錄

Linux安裝配置CGAL,OpenCV和Gurobi記錄

安裝Qt，查看當前的Qt版本，需要至少滿足v5.12 qmake -v安裝CGAL，The Computational Geometry Algorithms Library (cgal.org) CGAL v5.6.1：https://github.com/CGAL/cgal/releases/download/v5.6.1/CGAL-5.6.1.tar.xz 確保C編譯…

閱讀更多...

每日復盤-20240515

每日復盤-20240515

僅用于記錄當天的市場情況，用于統計交易策略的適用情況，以便程序回測短線核心：不參與任何級別的調整，采用龍空龍模式一支股票 10%的時候可以操作， 90%的時間適合空倉等待國聯證券 (1)|[9:25]|[133765萬]|31.12 一…

閱讀更多...

基于Pytorch深度學習神經網絡MNIST手寫數字識別系統源碼（帶界面和手寫畫板）

基于Pytorch深度學習神經網絡MNIST手寫數字識別系統源碼（帶界面和手寫畫板）

第一步：準備數據 mnist開源數據集第二步：搭建模型我們這里搭建了一個LeNet5網絡參考代碼如下： import torch from torch import nnclass Reshape(nn.Module):def forward(self, x):return x.view(-1, 1, 28, 28)class LeNet5(nn.Modul…

閱讀更多...

【數據結構】C++語言實現二叉樹的介紹及堆的實現(詳細解讀)

【數據結構】C++語言實現二叉樹的介紹及堆的實現(詳細解讀)

c語言中的小小白-CSDN博客c語言中的小小白關注算法,c,c語言,貪心算法,鏈表,mysql,動態規劃,后端,線性回歸,數據結構,排序算法領域.https://blog.csdn.net/bhbcdxb123?spm1001.2014.3001.5343 給大家分享一句我很喜歡我話： 知不足而奮進，望遠山而前行&am…

閱讀更多...

分布式系統的一致性與共識算法(三)

分布式系統的一致性與共識算法(三)

順序一致性(Sequential Consistency) ZooKeeper 一種說法是ZooKeeper是最終一致性，因為由于多副本、以及保證大多數成功的ZAB協議，當一個客戶端進程寫入一個新值，另外一個客戶端進程不能保證馬上就能讀到這個值，但是能保證最終能…

閱讀更多...

我的第一個網頁：武理天協

我的第一個網頁：武理天協

1. html代碼 1.1 首頁.html <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><title>武理天協</title><link rel"stylesheet" href"./style.css"><link rel"stylesh…

閱讀更多...

【車載開發系列】SID$11服務配置

【車載開發系列】SID$11服務配置

【車載開發系列】SID$11服務配置前言 ECUReset（ECU重置），ECU作為Server端，執行Client發送來ECU Reset請求中重啟的類型（通過子服務區分）。對于UDS協議關于處理該請求的邏輯，沒有強制性定義。 Step1：SID和SubFunction的追加 BasicEditor→Dcm→DcmConfigSet→DcmDs…

閱讀更多...

最新文章