GPU加速-系統CUDA12.5-Windows10

誤區注意

  • 查看當前系統可支持的最高版本cuda:nvidia-smi
    在這里插入圖片描述
    • 說明:
      • 此處顯示的12.7只是驅動對應的最高版本,不一定是 / 也不一定需要是 當前Python使用的版本。
      • 但我們所安裝的CUDA版本需要 小于等于它(即≤12.7)
      • 因此即使我此處顯示的是12.7,我依然可以使用12.5的cuda,并不需要卸載再重新安裝
  • 可以在CUDA文件夾下查看,電腦是否安裝了多個版本CUDA(多版本CUDA,可能是 “ pytorch找不到匹配,從而發生錯誤 ” 的原因之一)
    • 可以通過找NVIDIA GPU Computing Toolkit文件夾,找到CUDA安裝路徑,從而查看電腦里安裝了幾個CUDA(再次注意,上面的12.7并不屬于其中一個。安裝了幾個版本CUDA只看這個文件夾里有幾個即可)
    • 比如我的電腦只有一個12.5版本的CUDA在這里插入圖片描述

安裝CUDA Toolkit(即CUDA)

  • 之前從沒安裝過CUDA的,可以參考如下過程。
    • 該部分內容是整合如下兩篇博文的,因為我之前已經安裝了,但沒有一步步記錄。
    • 本來是想直接附這倆博文鏈接,但單看它倆是有缺漏的,所以我把它們結合整理一下,看著比較方便。
  • 1、先根據這篇文章完成基礎的CUDA安裝,但要注意如下提示。
    • 參考博文1:基礎CUDA安裝(缺少安裝后的一些工作)
    • 提示①:3.2中的安裝路徑可以不默認C盤,以免占據太大空間(但你要記住安裝路徑,后續添加系統環境變量時要用)
    • 提示②:3.5中取消勾選Visual Studio是由于若系統未安裝VS,勾選后會出錯。但如果已安裝VS,則可以勾選。
    • 提示③:在4中,若命令窗口輸入nvcc -V沒有顯示不必擔心,可能是因為該博文缺少了添加環境變量的步驟,此時點開下面第二個博文鏈接。
  • 2、接著跟著博文2的步驟2~5完成cuDNN和pytorch-gpu的安裝(其中涉及CUDA Toolkit的安裝在博文1中已安裝,可跳過)
    • 參考博文2:安裝后續講得比較清楚完整
    • 提示①:在3中的虛擬環境Python可安裝3.8版,不是一定3.11
    • 提示②:雖然我安裝的是CUDA12.5,沒有直接匹配的pytorch12.5,但可以安裝pytorch12.4
    • 提示③:pytorch-gpu若文件太大(一般都幾個G),可以直接在官網或者網絡的其他渠道下載到whl文件后 → 進入虛擬環境 → 直接pip install (whl文件名),能比較快一點。比如:
      • 我安裝時嫌2G多太慢,就直接點開*.whl鏈接,用另一個有線網電腦幾分鐘下載后(或者也可以找其他渠道下載到同名文件),總之把whl文件放在本地在這里插入圖片描述
      • (記得切換到虛擬環境下后),再直接pip安裝即可。
        在這里插入圖片描述
      • 如上安裝了torch后,還要安裝倆小的,直接再輸入命令即可:
        在這里插入圖片描述

使用加速

  • 根據博文2的步驟5中torch.cuda.is_available()結果顯示True后,即可開始訓練了。
  • 開另個窗口輸入nvidia-smi后:
    • CUDA 版本(驅動支持): 12.7(但我的 PyTorch 是 cu124 版本,CUDA可向下兼容)
    • 可以查看當前的內存使用:1970MiB / 6144MiB → 表示當前 Python 程序大約使用了 2GB 顯存
      在這里插入圖片描述
    • 也可顯示正在使用GPU的進程,與其指向的虛擬環境在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/80589.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/80589.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/80589.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

IOT項目——DIY 氣象站

開源項目:ESP32 氣象站 作者:GiovanniAggiustatutto 原文鏈接:原文 開源項目:太陽能 WiFi 氣象站 V4.0 作者:opengreenenergy 原文鏈接:原文 DIY 氣象站 簡介1-制版2-物料 溫度設備塔風向標風速計雨量計框…

5G助力智慧城市的崛起——從概念到落地的技術實踐

5G助力智慧城市的崛起——從概念到落地的技術實踐 引言:智慧城市中的“隱形脈絡” 隨著城市化的快速推進,傳統的城市管理方式已經難以滿足人口增長和資源優化的需求。智慧城市的概念應運而生,通過技術創新實現智能化、可持續發展的城市生態…

【Linux】web服務器的部署和優化

目錄 nginx的安裝與啟用--/usr/share/nginx/html默認發布目錄 nginx的主配置文件--/etc/nginx/nginx_conf nginx的端口 nginx默認發布文件--index.html nginx默認發布目錄 nginx的訪問控制 基于IP地址的訪問控制 基于用戶認證的訪問控制 nginx的虛擬主機--/etc/nginx/…

結合五層網絡結構講一下用戶在瀏覽器輸入一個網址并按下回車后到底發生了什么?

文章目錄 實際應用第一步:用戶在瀏覽器輸入 www.baidu.com 并按下回車1. 瀏覽器觸發域名解析(DNS查詢) 第二步:DNS請求的逐層封裝與傳輸1. 應用層(DNS協議)2. 傳輸層(UDP協議)3. 網絡…

深入理解N皇后問題:從DFS到對角線優化

N皇后問題是一個經典的算法問題,要求在NN的棋盤上放置N個皇后,使得它們互不攻擊。本文將全面解析該問題的解法,特別聚焦于DFS算法和對角線優化的數學原理。 問題描述 在NN的國際象棋棋盤上放置N個皇后,要求: 任意兩個…

Java面試場景篇:分布式鎖的實現與組件詳解

互聯網大廠Java求職者面試:分布式鎖的實現與組件 在一場緊張而又充滿挑戰的面試中,Java架構師馬架構正面對著一位經驗豐富的面試官。以下是他們之間關于分布式鎖實現方式及相關問題的對話。 第一輪提問 面試官:請介紹一下分布式鎖的概念。…

關于使用 讀光-文字檢測-DBNet行檢測模型-中英-通用領域,版本問題

關于使用 讀光-文字檢測-DBNet行檢測模型-中英-通用領域,版本問題 pip install modelscopeSuccessfully installed certifi-2025.4.26 charset-normalizer-3.4.1 colorama-0.4.6 idna-3.10 modelscope-1.25.0 requests-2.32.3 tqdm-4.67.1 urllib3-2.4.0 pip insta…

刷刷刷刷刷RCE

云曦歷年考核 25年春開學考 RCCCE 開啟題目進行代碼審計 GET傳參傳入一個參數cmd&#xff0c;但對參數內容給了黑名單進行過濾 $blacklist /bash|nc|wget|ping|ls|cat|more|less|phpinfo|base64|echo|php|python|mv|cp|la|\-|\*|"|\>|\<|\%|\$/i; ls、cat等都…

2024江西ICPC部分題解

題目列表 A - Maliang Learning PaintingC - LiarG - Multiples of 5H - ConvolutionJ - Magic MahjongK - Magic Tree A - Maliang Learning Painting 題目來源&#xff1a;A - Maliang Learning Painting 思路分析 這是個簽到題&#xff0c;直接輸出abc即可 #include<b…

Pytorch圖像數據轉為Tensor張量

PyTorch的所有模型&#xff08;nn.Module&#xff09;都只接受Tensor格式的輸入&#xff0c;所以我們在使用圖像數據集時&#xff0c;必須將圖像轉換為Tensor格式。PyTorch提供了torchvision.transforms模塊來處理圖像數據集。torchvision.transforms模塊提供了一些常用的圖像預…

為什么vllm能夠加快大模型推理速度?

vLLM加速大模型推理的核心技術原理可分解為以下關鍵創新點&#xff1a; 一、?內存管理革命&#xff1a;PagedAttention? KV Cache分頁機制? 將傳統連續存儲的KV Cache拆分為非連續內存頁&#xff0c;類似操作系統內存分頁管理&#xff0c;消除內存碎片并實現動態分配。13B…

第十一章 多態

多態是面向對象開發過程中一個非常重要的概念。 11.1 多態概述 11.1.1 什么是多態 多態&#xff08;polymorphism&#xff09;&#xff0c;從字面理解是“多種形態&#xff0c;多種形式”&#xff0c;是一種將不同的特殊行為泛化為當個特殊記號的機制。 多態從實現的角度可劃…

RNN——循環神經網絡

一.基本結構 1.目標&#xff1a;處理序列數據&#xff08;時間序列&#xff0c;文本&#xff0c;語音等&#xff09;&#xff0c;捕捉時間維度上的依賴關系 核心機制&#xff1a;通過隱藏狀態&#xff08;hidden State&#xff09;傳遞歷史信息&#xff0c;每個時間步的輸入包…

性能提升手段--池化技術

看到hadoop代碼里有ByteBufferPool,使用池子來避免頻繁創建、銷毀ByteBuffer,減輕GC壓力,提高性能。 順便總結一下池化技術 一、什么是池化技術??? ??池化(Pooling)?? 是一種資源管理策略,通過??預先創建并復用資源??(如數據庫連接、線程、內存對象等)來提…

數據安全和合規性市場分析

一、什么是數據安全和合規性 在數據安全和合規性方面&#xff0c;存在著一系列重要的法律、法規和行業標準&#xff0c;這些規定了組織如何收集、存儲、處理和保護個人數據及其他敏感信息。企業之所以要遵守這些規定&#xff0c;是出于多方面的考量&#xff0c;既有法律責任&a…

【每日八股】復習計算機網絡 Day4:TCP 協議的其他相關問題

文章目錄 昨日內容復習已經建立了 TCP 連接&#xff0c;客戶端突然出現故障怎么辦&#xff1f;什么時候用長連接&#xff1f;短連接&#xff1f;TCP 的半連接隊列與全連接隊列&#xff1f;什么是 SYN 攻擊&#xff1f;如何避免&#xff1f;TIME_WAIT 的作用&#xff1f;過多如何…

React:<></>的存在是為了什么

1. <></> 是什么&#xff1f; <></> 是 React 的Fragment&#xff08;片段&#xff09;語法糖&#xff0c;等價于 <React.Fragment></React.Fragment>。 2. 它的作用 主要作用&#xff1a; 允許你在組件里返回多個元素&#xff0c;而不需…

cron定時任務

cron定時任務 一、Cron表達式的定義 基礎結構 Cron表達式是由空格分隔的6或7個字段組成的字符串&#xff0c;格式為&#xff1a; 秒 分 時 日 月 星期 [年]其中&#xff0c;年通常可以被省略 字段說明&#xff1a; 秒&#xff08;0-59&#xff09; 秒字段表示每分鐘的哪一…

分布式之易混淆概念

昨天寫UE寫的破防了&#xff0c;忘了寫文章&#xff0c;今天補一下分布式的一些概念。&#x1f61a; 在軟件架構領域&#xff0c;微服務、領域驅動設計&#xff08;DDD&#xff09;和分布式系統是三個高頻且容易被混淆的概念。許多開發者誤以為它們是“同一件事的不同說法”&a…

量子躍遷:Vue組件安全工程的基因重組與生態免疫(完全體終局篇)

開篇數字免疫系統的范式革命 在2025年某國際金融峰會期間&#xff0c;黑客組織利用量子計算技術對全球37個交易系統發起協同攻擊。傳統安全組件在2.7秒內集體失效&#xff0c;造成每秒超18億美元的交易漏洞。這場數字"切爾諾貝利"事件促使我們重新定義前端安全——組…