huggingface 筆記:查看GPU占用情況

0 準備部分

0.1?創建虛擬數據

import numpy as npfrom datasets import Datasetseq_len, dataset_size = 512, 512
dummy_data = {"input_ids": np.random.randint(100, 30000, (dataset_size, seq_len)),"labels": np.random.randint(0, 1, (dataset_size)),
}
dummy_data
'''
使用 np.random.randint 函數生成一個形狀為 (dataset_size, seq_len),即 512x512 的數組。
數組中的每個元素是一個隨機整數,范圍從 100 到 30000。使用 np.random.randint 函數生成一個形狀為 (dataset_size,) 的數組,其中的元素是 0 或 1
表示每個樣本的標簽
'''
'''
{'input_ids': array([[11687,  1246,  6661, ..., 20173,  3772, 29152],[  720, 25945, 11963, ..., 11675, 27842,  3553],[22100, 26587, 19452, ...,  1836, 24395, 22849],...,[11610, 24425,  1026, ...,  6237, 28503,  2775],[10266, 22622, 14079, ..., 24491, 26029, 17796],[11500,  7688, 13780, ...,  4839, 13967, 18493]]),'labels': array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0])}
'''
ds = Dataset.from_dict(dummy_data)
ds.set_format("pt")
#將它們存儲在一個帶有PyTorch格式的數據集中
ds
'''
Dataset({features: ['input_ids', 'labels'],num_rows: 512
})
'''

0.2 輔助函數

為了打印GPU利用率和使用Trainer進行訓練運行的摘要統計信息,定義了兩個輔助函數

0.2.1 打印GPU內存使用情況

from pynvml import *def print_gpu_utilization(device_id=1):nvmlInit()#初始化 NVML 庫handle = nvmlDeviceGetHandleByIndex(device_id)#獲取索引為 device_id 的 GPU 設備的句柄。info = nvmlDeviceGetMemoryInfo(handle)'''使用前面獲取的句柄,查詢該 GPU 的內存信息。返回的對象包含了 GPU 內存的總量、已使用的量和空閑的量。'''print(f"GPU內存占用:{info.used // 1024 ** 2} MB。")'''打印 GPU 當前已使用的內存量,單位為 MB。這里通過將字節單位的值除以 1024 的平方來轉換為 MB
print_gpu_utilization()
#GPU內存占用:270 MB。

0.2.2 打印訓練過程的信息

def print_summary(result):print(f"時間:{result.metrics['train_runtime']:.2f}")'''打印訓練過程的運行時間從 result 對象中的 metrics 字典獲取 'train_runtime' 鍵的值格式化為兩位小數。'''print(f"樣本/秒:{result.metrics['train_samples_per_second']:.2f}")'''打印訓練速度,即每秒處理的樣本數從 result 對象中的 metrics 字典獲取 'train_samples_per_second' 鍵的值格式化為兩位小數。'''print_gpu_utilization()#調用 print_gpu_utilization() 函數來打印 GPU 的內存使用情況

1 加載模型,查看GPU空間占用情況

print_gpu_utilization(1)
#print_gpu_utilization(1)from transformers import AutoModelForSequenceClassificationmodel = AutoModelForSequenceClassification.from_pretrained("google-bert/bert-large-uncased").to("cuda:1")
print_gpu_utilization(1)
#GPU內存占用:1866 MB。

2? 訓練模型時的GPU占用情況

default_args = {"output_dir": "tmp","eval_strategy": "steps","num_train_epochs": 1,"log_level": "error","report_to": "none",
}
'''
output_dir: 指定輸出目錄,這里設置為 "tmp"。
eval_strategy: 設置評估策略為 "steps",意味著在訓練過程中會按照步驟進行模型評估。
num_train_epochs: 設置訓練周期為 1,即整個訓練集只會被訓練一遍。
log_level: 設置日志級別為 "error",這樣只有錯誤信息會被記錄。
report_to: 設置報告輸出目標為 "none",這表示不將訓練進度報告輸出到任何外部服務或控制臺。
'''
from transformers import TrainingArguments, Trainer, logginglogging.set_verbosity_error()
#讓 transformers 庫只輸出錯誤級別的日志。training_args = TrainingArguments(per_device_train_batch_size=1,**default_args)
'''
TrainingArguments: 創建一個訓練參數對象,設置每個設備的訓練批量大小為 1
并將前面定義的默認參數集成進來。
'''
trainer = Trainer(model=model, args=training_args, train_dataset=ds)
#Trainer: 初始化訓練器,傳入模型、訓練參數和訓練數據集。
result = trainer.train()
#使用 trainer.train() 啟動訓練過程,并將結果存儲在 result 變量中
print_summary(result)

在我這邊的GPU上跑不起來:可能是不同版本的cuda、pytorch導致的(不確定)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/15935.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/15935.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/15935.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

學習和分享關于 Vue.js 的路由(vue-router)

學習和分享關于 Vue.js 的路由(vue-router)是一個非常有價值的主題,因為路由是構建單頁應用程序(SPA)的核心部分。本文將介紹 Vue.js 路由的基本概念和實現,并展示一個典型的項目目錄結構。 目錄 Vue.js 路…

【代碼隨想錄訓練營】【Day 29】【回溯-3】| Leetcode 39, 41, 131

【代碼隨想錄訓練營】【Day 29】【回溯-3】| Leetcode 39, 41, 131 需強化知識點 startInex作用:一是處理是否可以有重復值,二是實現縱向遍歷(不能沒有)去重要在數組有序的前提下進行分割問題 題目 39.…

工業控制2D組態界面,丑是丑了點,但非常實用。

工業控制的2D組態界面是用于監控和控制工業過程的界面。它通常具有以下特征: 實時數據顯示:2D組態界面能夠實時顯示傳感器和設備的數據,如溫度、壓力、流量等。這些數據以圖表、儀表盤、數字顯示等形式呈現,使操作人員能夠實時了解…

Android:使用Kotlin搭建MVVM架構模式

一、簡介Android MVVM架構模式 MVVM全稱:Model、View、ViewModel; Model:負責數據的請求、解析、過濾等數據層操作,其中Repository: 提供數據的 API(從本地或者網絡)。View:負責視圖部分展示Vie…

Spring (18)什么是JdbcTemplate

JdbcTemplate 是 Spring 框架提供的一個主要的類,旨在簡化傳統 JDBC 的使用。它處理了諸如連接管理、異常處理等繁瑣的低級任務,讓開發者可以更專注于執行 SQL 語句和處理結果。JdbcTemplate 屬于 Spring JDBC 模塊(spring-jdbc)&…

每日力扣刷題day05(小白簡單題)

文章目錄 2024.5.26(5題)1446.連續字符題解一題解二 2824.統計和小于目標的下標對數目題解一題解二 1768.交替合并字符串題解一題解二題解三 796.旋轉字符串題解一題解二 1304.和為零的 N 個不同整數題解一題解二 2024.5.26(5題) …

快速冪求逆元與逆元

我上一篇博客鏈接寫的是多個數求乘法逆元而快速冪求逆元用于單個數求乘法逆元 逆元是對分數取模用的 對于除法取模不成立,即(a/b)%p≠(a%p/b%p)%p。求逆元的思路:(一般ACM的題目都是對1e97這種素數取模,所以gcd(a,p)1)a*b1(mod p) > b1/a…

[Algorithm][動態規劃][簡單多狀態DP問題][按摩師][打家劫舍Ⅱ][刪除并獲得點數][粉刷房子]詳細講解

目錄 1.按摩師1.題目鏈接2.算法思路詳解3.代碼實現 2.打家劫舍 II1.題目鏈接2.算法思路詳解3.代碼實現 3.刪除并獲得點數1.題目鏈接2.算法思路詳解3.代碼實現 4.粉刷房子1.題目鏈接2.算法思路詳解3.代碼實現 1.按摩師 1.題目鏈接 按摩師 2.算法思路詳解 思路: 確…

大模型提示詞Prompt學習

引言 關于chatGPT的Prompt Engineer,大家肯定耳朵都聽起繭了。但是它的來由?,怎么能用好?很多人可能并不覺得并不是一個問題,或者說認定是一個很快會過時的概念。但其實也不能說得非常清楚(因為覺得沒必要深…

Redis第18講——Redis和Redission實現延遲消息

即使不是做電商業務的同學,也一定知道訂單超時關閉這種業務場景,這個場景大致就是用戶下單后,如果在一定時間內未支付(比如15分鐘、半小時),那么系統就會把這筆訂單給關閉掉。這個功能實現的方式有很多種&a…

unity開發Hololens 制作滑動框

一定要做到最后一步,才會有效果 1、創建空物體 ,并添加組件 創建空物體 命名ScrollingObjectCollection, 添加組件如下圖 下面是各個組件展開的內容 2、在ScrollingObjectCollection 下面創建兩個空物體,分別命名Container、Clipping…

運籌說 第115期 | 排隊論經典例題講解

通過前幾期的學習,我們已經學會了排隊論的基本概念、生滅過程和Poisson過程,等待制排隊模型、混合制排隊模型、其他排隊模型以及排隊系統優的定義與相關求解方法。在實際工作中,我們能發現排隊論在經濟管理中有著許多應用,本期小編…

大數據量上傳FTP

背景 筆者有一個需求是把將近一億條數據上傳到FTP服務器中,這些數據目前是存儲在mysql中,是通過關聯幾張表查詢出來的,查詢出來的數據結果集一共是6個字段。要求傳輸的時候拆分成一個個小文件,每個文件大小不能超過500M。我的測試…

FuTalk設計周刊-Vol.052

#AI漫談 熱點捕手 1.ChatGPT 大更新!GPT-4 開始又變聰明了 OpenAI 官方宣布,新版 GPT-4 Turbo 今天開始向所有付費 ChatGPT 用戶開放。 鏈接https://www.pconline.com.cn/focus/1733/17330089.html 2.刷爆多模態任務榜單!賈佳亞團隊Mini-G…

Linux下環境變量配置出錯導致基礎命令使用不了的問題解決

問題: 當配置環境變量: echo export PATH/home/ubuntu/.local/lib/python3.8/site-packages :$PATH >> ~/.bashrc 執行生效命令 source ~/.bashrc 出現所有的基礎操作命令:ls vim都使用不了 解決方式: 1&#xff09…

21.2zabbix低級自動發現-mysql多實例

配置mysql多實例 注釋:自動發現:創建監控主機;低級自動發現:創建監控項 mysql單實例是直接yum安裝,開啟mysql多實例 準備配置文件 #mysql3307實例 cp /etc/my.cnf /etc/my3307.cnf vim /etc/my3307.cnf [mysqld] dat…

lazarus-IDE 可以開發 Node.js 嗎?

Lazarus IDE 本身不是用來開發 Node.js 應用程序的工具,因為它是一個用于開發跨平臺應用程序的環境,類似于 C Builder 或 Delphi。Node.js 是一個基于 JavaScript 的運行時環境,通常使用 V8 引擎,用于構建異步、事件驅動的服務器端…

產品經理-流程圖結構圖(四)

1. 流程圖 1.1 概念 為了達到特定的目標而進行的一系列有邏輯性的操作步驟,由兩個及以上的步驟,完成一個完整的行為的過程,可稱之為流程 1.2 產品經理為什么需要繪制流程圖? 保證產品的使用邏輯合理順暢向項目組其他成員清晰的…

代碼隨想錄算法訓練營Day4|24. 兩兩交換鏈表中的節點、19.刪除鏈表的倒數第N個節點、 142.環形鏈表II、面試題 02.07. 鏈表相交

24. 兩兩交換鏈表中的節點 這道題的關鍵在于: 1、在置換兩個節點的時候,當前節點需要在這倆節點之前一個節點。并且要提前保存cur.next以及cur.next.next。 2、每次置換完一組節點,cur cur.next.next 3、判斷結束的標志:奇數個節點&#xf…

如何禁止U盤拷貝文件|禁止U盤使用的軟件有哪些

禁止U盤拷貝文件的方法有很多,比如使用注冊表、組策略編輯器等,但這些方法都適合個人,不適合企業,因為企業需要對下屬多臺電腦進行遠程管控,需要方便、省時、省力的方法。目前來說,最好的方法就是使用第三方…