Linux下如何設置CUDA的路徑

今天遇到一個關于CUDA的問題,我要跑的深度學習代碼,他里面有cuda編程,需要編譯。但是你運行就報錯。

代碼提示我大段報錯。

(score-denoise) ubuntu@GPUA10002:~/wbd/score-denoise_Transformerdepth20$ python train.py 
Detected CUDA files, patching ldflags
Emitting ninja build file /home/ubuntu/wbd/score-denoise_Transformerdepth20/utils/cutils/build/build.ninja...
Building extension module cutils_...
Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
[1/3] /usr/bin/nvcc  -DTORCH_EXTENSION_NAME=cutils_ -DTORCH_API_INCLUDE_EXTENSION_H -DPYBIND11_COMPILER_TYPE=\"_gcc\" -DPYBIND11_STDLIB=\"_libstdcpp\" -DPYBIND11_BUILD_ABI=\"_cxxabi1011\" -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/torch/csrc/api/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/TH -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/THC -isystem /data/miniconda3/envs/score-denoise/include/python3.8 -D_GLIBCXX_USE_CXX11_ABI=0 -D__CUDA_NO_HALF_OPERATORS__ -D__CUDA_NO_HALF_CONVERSIONS__ -D__CUDA_NO_BFLOAT16_CONVERSIONS__ -D__CUDA_NO_HALF2_OPERATORS__ --expt-relaxed-constexpr -gencode=arch=compute_80,code=compute_80 -gencode=arch=compute_80,code=sm_80 --compiler-options '-fPIC' -Xptxas -v --generate-code=arch=compute_80,code=sm_80 -std=c++14 -c /home/ubuntu/wbd/score-denoise_Transformerdepth20/utils/cutils/srcs/half_aligned_knn_sub_maxpooling.cu -o half_aligned_knn_sub_maxpooling.cuda.o 
FAILED: half_aligned_knn_sub_maxpooling.cuda.o 
/usr/bin/nvcc  -DTORCH_EXTENSION_NAME=cutils_ -DTORCH_API_INCLUDE_EXTENSION_H -DPYBIND11_COMPILER_TYPE=\"_gcc\" -DPYBIND11_STDLIB=\"_libstdcpp\" -DPYBIND11_BUILD_ABI=\"_cxxabi1011\" -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/torch/csrc/api/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/TH -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/THC -isystem /data/miniconda3/envs/score-denoise/include/python3.8 -D_GLIBCXX_USE_CXX11_ABI=0 -D__CUDA_NO_HALF_OPERATORS__ -D__CUDA_NO_HALF_CONVERSIONS__ -D__CUDA_NO_BFLOAT16_CONVERSIONS__ -D__CUDA_NO_HALF2_OPERATORS__ --expt-relaxed-constexpr -gencode=arch=compute_80,code=compute_80 -gencode=arch=compute_80,code=sm_80 --compiler-options '-fPIC' -Xptxas -v --generate-code=arch=compute_80,code=sm_80 -std=c++14 -c /home/ubuntu/wbd/score-denoise_Transformerdepth20/utils/cutils/srcs/half_aligned_knn_sub_maxpooling.cu -o half_aligned_knn_sub_maxpooling.cuda.o 
nvcc fatal   : Unsupported gpu architecture 'compute_80'
[2/3] /usr/bin/nvcc  -DTORCH_EXTENSION_NAME=cutils_ -DTORCH_API_INCLUDE_EXTENSION_H -DPYBIND11_COMPILER_TYPE=\"_gcc\" -DPYBIND11_STDLIB=\"_libstdcpp\" -DPYBIND11_BUILD_ABI=\"_cxxabi1011\" -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/torch/csrc/api/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/TH -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/THC -isystem /data/miniconda3/envs/score-denoise/include/python3.8 -D_GLIBCXX_USE_CXX11_ABI=0 -D__CUDA_NO_HALF_OPERATORS__ -D__CUDA_NO_HALF_CONVERSIONS__ -D__CUDA_NO_BFLOAT16_CONVERSIONS__ -D__CUDA_NO_HALF2_OPERATORS__ --expt-relaxed-constexpr -gencode=arch=compute_80,code=compute_80 -gencode=arch=compute_80,code=sm_80 --compiler-options '-fPIC' -Xptxas -v --generate-code=arch=compute_80,code=sm_80 -std=c++14 -c /home/ubuntu/wbd/score-denoise_Transformerdepth20/utils/cutils/srcs/aligned_knn_sub_maxpooling.cu -o aligned_knn_sub_maxpooling.cuda.o 
FAILED: aligned_knn_sub_maxpooling.cuda.o 
/usr/bin/nvcc  -DTORCH_EXTENSION_NAME=cutils_ -DTORCH_API_INCLUDE_EXTENSION_H -DPYBIND11_COMPILER_TYPE=\"_gcc\" -DPYBIND11_STDLIB=\"_libstdcpp\" -DPYBIND11_BUILD_ABI=\"_cxxabi1011\" -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/torch/csrc/api/include -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/TH -isystem /data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/include/THC -isystem /data/miniconda3/envs/score-denoise/include/python3.8 -D_GLIBCXX_USE_CXX11_ABI=0 -D__CUDA_NO_HALF_OPERATORS__ -D__CUDA_NO_HALF_CONVERSIONS__ -D__CUDA_NO_BFLOAT16_CONVERSIONS__ -D__CUDA_NO_HALF2_OPERATORS__ --expt-relaxed-constexpr -gencode=arch=compute_80,code=compute_80 -gencode=arch=compute_80,code=sm_80 --compiler-options '-fPIC' -Xptxas -v --generate-code=arch=compute_80,code=sm_80 -std=c++14 -c /home/ubuntu/wbd/score-denoise_Transformerdepth20/utils/cutils/srcs/aligned_knn_sub_maxpooling.cu -o aligned_knn_sub_maxpooling.cuda.o 
nvcc fatal   : Unsupported gpu architecture 'compute_80'
ninja: build stopped: subcommand failed.
Traceback (most recent call last):File "/data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1666, in _run_ninja_buildsubprocess.run(File "/data/miniconda3/envs/score-denoise/lib/python3.8/subprocess.py", line 516, in runraise CalledProcessError(retcode, process.args,
subprocess.CalledProcessError: Command '['ninja', '-v']' returned non-zero exit status 1.The above exception was the direct cause of the following exception:Traceback (most recent call last):File "train.py", line 13, in <module>from models.denoise import *File "/home/ubuntu/wbd/score-denoise_Transformerdepth20/models/denoise.py", line 7, in <module>from .feature import FeatureExtractionWithResLFEFile "/home/ubuntu/wbd/score-denoise_Transformerdepth20/models/feature.py", line 6, in <module>from .ResLFE_block import ResLFE_BlockFile "/home/ubuntu/wbd/score-denoise_Transformerdepth20/models/ResLFE_block.py", line 8, in <module>from utils.cutils import knn_edge_maxpoolingFile "/home/ubuntu/wbd/score-denoise_Transformerdepth20/utils/cutils/__init__.py", line 14, in <module>cutils = load("cutils_", sources=sources, extra_cflags=["-O3", "-mavx2", "-funroll-loops"], extra_cuda_cflags=["-Xptxas","-v",  "--generate-code=arch=compute_80,code=sm_80"],File "/data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1080, in loadreturn _jit_compile(File "/data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1293, in _jit_compile_write_ninja_file_and_build_library(File "/data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1405, in _write_ninja_file_and_build_library_run_ninja_build(File "/data/miniconda3/envs/score-denoise/lib/python3.8/site-packages/torch/utils/cpp_extension.py", line 1682, in _run_ninja_buildraise RuntimeError(message) from e
RuntimeError: Error building extension 'cutils_'

然后你問ai,ai給你的建議是查看nvcc版本

nvcc --version

然后你發現,沒有這個,然后會提示你

sudo apt install nvidia-cuda-toolkit

然后你又去安裝,安裝好后查看了一下

(base) ubuntu@GPUA10002:~/wbd/score-denoise_Transformerdepth20$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85

發現這是很老的版本

新版本的這樣的提示

(score-denoise) wu@wu:~/code/pointDenoise/score-denoise_Transformerdepth20$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Built on Tue_Feb_27_16:19:38_PST_2024
Cuda compilation tools, release 12.4, V12.4.99

然后老版本的,我就編譯不通過。

然后我就一直在查找相關問題,一直在想,沒安裝nvcc前,別人也能夠跑深度學習,然后感覺很奇怪。

然后我后面把這個卸載了

sudo apt remove nvidia-cuda-toolkit

這個是可以卸載的,大家放心。

然后就報錯CUDA路徑的問題
在這里插入圖片描述然后我就去~/.bashrc

在這里插入圖片描述發現里面是有這個路徑的,然后我就試著在終端輸入

export PATH=/usr/local/cuda-12.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64:$LD_LIBRARY_PATH

還是不行。

然后我就沒轍了。

最后的最后,我進入/usr/local查看,發現他下載的是cuda-12.0,不是12.1

在這里插入圖片描述

然后我就在我要跑的代碼終端,輸入下面兩個命令,然后執行跑代碼,就能夠編譯通過了。

export PATH=/usr/local/cuda-12.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.0/lib64:$LD_LIBRARY_PATH

我也不知道為啥,~/.bashrc里面為啥不是cuda-12.1,所以我也沒有把他里面改成12.1,就按照原來的吧,以后要跑,直接先輸入這兩行命令,然后執行代碼,當然,如果你不要編譯,你直接運行是沒有關系的。

這個問題,浪費了我一下午的時間,如果你也有相關問題,一定要注意,去看看/usr/local/到底是多少版本的cuda。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/89811.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/89811.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/89811.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

js樹的排序

樹 樹的前中后序遍歷 樹是一種重要的非線性數據結構&#xff0c;尤其是二叉樹。二叉樹的遍歷是操作樹的基礎&#xff0c;主要有前序遍歷、中序遍歷和后序遍歷三種方式。 前序遍歷 訪問順序&#xff1a;根結點 -> 左子樹 -> 右子樹。 遍歷規則&#xff1a;首先訪問根結…

解碼 Red Stuff:Walrus 高效可靠存儲的引擎

Red Stuff 是 Walrus 所采用的二維&#xff08;2D&#xff09;糾刪碼協議&#xff0c;定義了數據如何被編碼和存儲。它是實現高效、安全、且高可用的去中心化存儲的關鍵。通過 Red Stuff&#xff0c;Walrus 成功解決了去中心化存儲系統常見的三大難題&#xff1a;安全性、復制效…

【ACP】阿里云云計算高級運維工程師--ACP

文章目錄1、簡要介紹2、核心特點3、考試相關信息4、適合人群1、簡要介紹 阿里云云計算認證ACP&#xff08;Alibaba Cloud Certified Professional&#xff09;是面向云計算技術與應用從業者的專業級認證&#xff0c;旨在評估考生對阿里云云計算產品的理解、部署、運維及最佳實…

快速掌握Python編程基礎

干貨分享&#xff0c;感謝您的閱讀&#xff01;備注&#xff1a;本博客將自己初步學習Python的總結進行分享&#xff0c;希望大家通過本博客可以在短時間內快速掌握Python的基本程序編碼能力&#xff0c;如有錯誤請留言指正&#xff0c;謝謝&#xff01;&#xff08;持續更新&a…

「Java案例」雞兔同籠問題

案例解析 雞兔同籠求解 《孫子算經》是中國古代重要的數學著作&#xff0c;成書于南北朝時期&#xff0c;其中就記載了一個有趣的問題&#xff1a;雞和兔在同一個籠子里&#xff0c;雞和兔共有n條腿&#xff0c; m個頭&#xff0c;問雞和兔各有多少只&#xff1f;編寫一個程序…

BLDC電機-運動控制---stm32時鐘樹定時器SYSTICKRTC的學習

一、時鐘樹 二、基本定時器 三、通用定時器 四、高級定時器 五、SYSTICK 六、RTC

Implementing a User-Defined Preconditioner in PETSc

文章目錄Implementing a User-Defined Preconditioner in PETScBasic ApproachExample ImplementationUsing Your PreconditionerAdvanced OptionsImportant NotesUsing PCShell to Implement User-Defined Preconditioners in PETScBasic Implementation StepsAdvanced Featur…

DotNetBrowser 3.3.0 版本發布啦!

#Chromium 137 安全修復一次調用即可下載 URL更新了 Widevine APIDOM 元素絕對邊界 &#x1f517; 點擊此處了解更多詳情。 &#x1f193; 獲取 30 天免費試用。

Android-自定義View的實戰學習總結

一、自定義View歌詞界面LrcView 類-->自定義的歌詞視圖1. 構造函數和屬性初始化自定義 View 通常需要提供多個構造函數以支持不同的初始化方式。在 LrcView 中&#xff0c;提供了四個構造函數&#xff0c;最終調用 super 父類構造函數完成初始化&#xff0c; context.obtain…

Maven 在 Eclipse 中的使用指南

Maven 在 Eclipse 中的使用指南 概述 Maven 是一個強大的構建自動化工具,用于項目管理和構建。它簡化了項目構建、依賴管理和項目報告等任務。Eclipse 是一個流行的集成開發環境(IDE),支持多種編程語言,包括 Java。本文將詳細介紹如何在 Eclipse 中使用 Maven 進行項目管…

zxing去白邊

2025年了&#xff0c;可能干不了幾年了&#xff0c;還能寫這種文章還是有點可笑。 背景 zxing庫生成的二維碼自帶白邊 分析 生產二維碼主要分兩步&#xff1a; 1.用QRCodeWriter生成BitMatrix信息 2.根據信息生成bitmap 問題在1。 生成二維碼的尺寸實際是有一些規格的&a…

Linux操作系統之文件(三):緩沖區

前言&#xff1a; 上節課我們講授重定向的概念時&#xff0c;曾提到了一點緩沖區的概念。本文將會為大家更詳細的帶來緩沖區的有關內容&#xff1a;用戶級緩沖區是什么&#xff0c;以及其與內核級緩沖區的關系&#xff0c;最后&#xff0c;我會為大家模擬實現一下stdio.h的關于…

Linux云計算基礎篇(7)

一、< 輸入重定向 wc -l < filelist .txt 統計數據&#xff0c;從file這個文件拿結果。 二、tr 轉換字符命令 $ tr A-Za-z<.bash_profile 將bash_profile文件中的大寫字符全部轉成小寫字符 三、管道符&#xff08;|&#xff09; com…

【學習筆記】Lean4基礎 ing

文章目錄 概述參考文檔運行程序elan 命令行工具lean 命令行工具lake 命令行工具運行單文件程序Hello, world!驗證 Lean4 證明 運行多文件項目 Lean4 基礎語法注釋表達式求值變量和定義定義類型變量 定義函數命名規則命名空間數據類型結構體構造子模式匹配多態List 列表Option 可…

FPGA實現40G網卡NIC,基于PCIE4C+40G/50G Ethernet subsystem架構,提供工程源碼和技術支持

目錄 1、前言工程概述免責聲明 3、相關方案推薦我已有的所有工程源碼總目錄----方便你快速找到自己喜歡的項目我這里已有的以太網方案 4、工程詳細設計方案工程設計原理框圖測試用電腦PClE4CDMA40G/50G Ethernet subsystem工程源碼架構驅動和測試文件 5、Vivado工程詳解1詳解&a…

SAP從入門到放棄系列之流程管理概述

文章目錄前言1.Process Management&#xff08;過程管理&#xff09;2.關鍵術語2.1Control recipe destination2.2 Process instruction characteristic2.3 Process message characteristic2.4 Process instruction category2.5 Process message category2.6 PI sheet3.關鍵配置…

RCLAMP0554S.TCT升特Semtech 5通道TVS二極管,0.5pF+20kV防護,超高速接口!

RCLAMP0554S.TCT&#xff08;Semtech&#xff09;產品解析與推廣文案 一、產品定位 RCLAMP0554S.TCT是Semtech&#xff08;升特半導體&#xff09;推出的5通道超低電容TVS二極管陣列&#xff0c;專為超高速數據接口&#xff08;USB4/雷電4/HDMI 2.1&#xff09;提供靜電放電&a…

【人工智能】DeepSeek的AI實驗室:解鎖大語言模型的未來

《Python OpenCV從菜鳥到高手》帶你進入圖像處理與計算機視覺的大門! 解鎖Python編程的無限可能:《奇妙的Python》帶你漫游代碼世界 DeepSeek作為中國AI領域的先鋒,以其開源大語言模型(LLM)DeepSeek-V3和DeepSeek-R1在全球AI研究中掀起波瀾。本文深入探討DeepSeek AI實驗…

nacos+nginx動態配置大文件上傳限制

前言 今天還要跟大家分享的一個點就是微服務網關gateway用webflux響應式不用servlet后&#xff0c;引發的一個忽略點差點在演示的時候炸鍋&#xff0c;也不多講廢話&#xff0c;說說現象&#xff0c;說說處理就了事。 一、上傳超過20MB的視頻報錯 配置在nacos里&#xff0c;讀…

mr 任務運行及jar

mainclass如下&#xff1a;LoggingDriver