Linux運維筆記:1010實驗室電腦資源規范使用指南

文章目錄

  • 一. 檢查資源使用情況,避免沖突
      • 1. 檢查在線用戶
      • 2. 檢查 CPU 使用情況
      • 3. 檢查 GPU 使用情況
      • 4. 協作建議
  • 二. 備份重要文件和數據
  • 三. 定期清理硬盤空間
  • 四. 退出 ThinLinc 時注銷,釋放內存
  • 五. 校外使用時配置 VPN
    • 注意事項
  • 總結

實驗室的電腦配備了 CPU 和 GPU 資源,供多個子用戶共享使用。為了避免資源沖突、提高效率并保護數據安全,大家需要規范使用工作站。以下是詳細指導,幫助大家高效、協作地使用資源。

一. 檢查資源使用情況,避免沖突


在運行代碼前,務必檢查 CPU 和 GPU 的使用情況,確保不與他人任務沖突。一起運行代碼會降低性能,甚至導致程序崩潰。建議協商排隊使用。

1. 檢查在線用戶

  • 命令who
  • 作用:查看當前登錄工作站的用戶。
  • 操作:在終端輸入以下命令:
    who
    
  • 輸出示例
    user1   pts/0    2025-06-03 14:30 (192.168.1.10)
    user2   pts/1    2025-06-03 14:32 (10.0.0.5)
    
  • 說明:顯示在線用戶、登錄時間和來源 IP。聯系在線用戶,確認他們的任務狀態。

2. 檢查 CPU 使用情況

  • 命令htop
  • 作用:實時查看 CPU 和內存使用情況,識別占用資源的進程。
  • 操作
    1. 在終端輸入:
      htop
      
    2. 查看“CPU”欄,檢查使用率(例如 50% 表示一半負載)。
    3. F5 查看進程樹,找到占用 CPU 的用戶和程序(PID、用戶、命令等)。
  • 建議:如果 CPU 占用高(如 >80%),聯系相關用戶,協商錯開運行時間。

3. 檢查 GPU 使用情況

  • 命令nvidia-smi
  • 作用:查看 GPU 內存、利用率和運行進程。
  • 操作
    1. 在終端輸入:
      nvidia-smi
      
    2. 檢查“GPU-Util”列(GPU 利用率)和“Processes”部分(顯示 PID、用戶、程序名)。
  • 輸出示例
    +---------------------------------------------------------------------------------+
    | NVIDIA-SMI 550.54.14    Driver Version: 550.54.14    CUDA Version: 12.4        |
    |-------------------------------+----------------------+-------------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC    |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M.    |
    |===============================+======================+=========================|
    |   0  NVIDIA GeForce RTX 4090  Off  | 00000000:01:00.0 Off |                 Off    |
    | 30%   38C    P2    55W / 450W |  14704MiB / 24564MiB |      0%      Default    |
    +-------------------------------+----------------------+-------------------------+
    | Processes:                                                                      |
    |  GPU   GI   CI   PID   Type   Process name                  GPU Memory Usage    |
    |===============================+======================+=========================|
    |    0    N/A  N/A  12345   C    python                    14700MiB              |
    +-------------------------------+----------------------+-------------------------+
    
  • 建議:若 GPU 內存或利用率高,聯系占用者(通過 PID 對應用戶),商量排隊使用

4. 協作建議

  • 溝通:運行大任務前,與在線用戶溝通,確認資源可用性。
  • 排隊:協商使用時間,避免同時運行多個重負載任務。

二. 備份重要文件和數據


  • 重要性:工作站數據可能因硬件故障、誤操作或系統問題丟失。
  • 建議
    1. 定期備份重要代碼、數據和配置文件。
    2. 存儲位置:
      • 個人電腦硬盤
      • U 盤或移動硬盤
      • 云存儲(如百度網盤)
    3. 使用 SCP 命令FileZilla 軟件(如下截圖所示)可以快捷與個人主機文件傳輸
  • 注意:不要完全依賴工作站存儲,意外情況隨時可能發生!并且注意傳入工作站的文件是否安全,切勿將疑似帶有病毒的文件包傳入!

在這里插入圖片描述

三. 定期清理硬盤空間


  • 背景:工作站硬盤是公用的,空間有限,需共同維護。
  • 操作
    1. 檢查磁盤使用情況:
      df -h
      
      • 查看掛載點(如 /home)的剩余空間。
    2. 查找大文件或無用數據:
      du -sh /home/* | sort -hr
      
      • 列出目錄和文件大小,找出占用空間大的內容。
    3. 清理垃圾文件:
      • 刪除臨時文件、日志、舊數據包等。
      • 示例:刪除 *.tmp 文件:
        rm -rf /home/your_username/*.tmp
        
  • 建議
    • 將不必要的文件轉移到個人電腦或網盤。
    • 能不留的垃圾文件和數據包都刪除,保持硬盤整潔。
    • 定期(例如每周)檢查和清理。

四. 退出 ThinLinc 時注銷,釋放內存


  • 背景:ThinLinc 是實驗室常用的遠程桌面工具,退出時若不注銷,會話可能繼續占用內存,導致工作站性能下降或死機。

  • 操作

    1. 確認無程序需要后臺運行。
    2. 點擊桌面右上角的“注銷”按鈕(通常在系統菜單中)。
    3. 選擇“注銷”或“Log Out”,結束會話。

    在這里插入圖片描述

  • 好處

    • 釋放主機內存,減少資源占用。
    • 降低工作站死機風險,提高穩定性。
  • 注意

    • 但是若有長期任務(如訓練模型),要確保任務在后臺運行
    • 若再次登陸時,發現無法通過 ThinLinc 建立連接的問題,如下圖所示把End existing session勾選上再次嘗試
      在這里插入圖片描述

五. 校外使用時配置 VPN


  • 需求:在校外訪問實驗室工作站需通過學校網絡。
  • 操作
    1. 訪問學校官網,找到 IT 或網絡服務頁面。
    2. 下載 VPN 連接軟件:EasyConnect
    3. 安裝并配置:
      • 輸入學校提供的 VPN 服務器地址。
      • 使用您的學號/工號和密碼登錄。
    4. 連接成功后,通過 ThinLinc 或 SSH 訪問工作站。
  • 建議
    • 確保 EasyConnect 版本與學校要求一致。
    • 校外使用時,保持 VPN 連接穩定,避免中斷。

注意事項

  • 謹慎操作:管理員修改系統設置或刪除文件前,確認權限和影響。
  • 備份:所有建議中,備份和溝通始終是關鍵,保護代碼和數據。
  • 尊重他人:資源共享,優先溝通,協商使用

總結


規范使用實驗室電腦資源是大家的責任!運行代碼前檢查 CPU(htop)和 GPU(nvidia-smi),用 who 確認在線用戶,協商排隊;備份重要數據,定期清理硬盤;退出 ThinLinc 時注銷釋放內存;校外使用時配置 EasyConnect VPN。讓我們共同維護工作站的高效和穩定!

如有疑問,聯系實驗室管理員或群內討論。謝謝配合!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83535.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83535.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83535.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

手機郵箱APP操作

收發電子郵件方式 郵箱可以在網絡段登錄,也可以在手機端登錄。 大學網絡服務 收發電子郵件有三種方式: 1、Web方式: 1)登錄“網絡服務”(https://its.pku.edu.cn),點頁面頂端“郵箱”。 2&…

Dockerfile 使用多階段構建(build 階段 → release 階段)后端配置

錯誤Dockerfile配置示例: FROM python:3.11 as buildENV http_proxyhttp://172.17.0.1:7890 ENV https_proxyhttp://172.17.0.1:7890WORKDIR /appENV PYTHONPATH/app# Install Poetry # RUN curl -sSL https://install.python-poetry.org | POETRY_HOME/opt/poetry…

webstrom中git插件勾選提交部分文件時卻出現提交全部問題怎么解決

原因是我有個.husky的文件制定了執行提交的時候就是提交所有的文件 修改.husky/pre-commit文件就可以啦 #!/usr/bin/env sh . "$(dirname -- "$0")/_/husky.sh"# 獲取通過 WebStorm 提交的暫存文件(僅勾選的部分) STAGED_FILES$(gi…

OSG編譯wasm嘗試

最近遇到一個情況,需要嘗試一下OSG到webassembly 發現官網有教程 于是順著看了看,默認教程是xubuntu的一個系統跑的,但是我本著試一試的想法,拉下來直接在windows上跑,奇奇怪怪的報錯簡直頭皮發麻 然后怎么辦呢&#x…

QT中子線程觸發主線程彈窗并阻塞等待用戶響應-傳統信號槽實現

目錄 QT中子線程觸發主線程彈窗并阻塞等待用戶響應傳統信號槽實現實現思路具體步驟1. 定義信號與槽2. 異步任務中觸發彈窗3. 主線程處理彈窗4. 連接信號與槽關鍵點總結 更簡單實現 QT中子線程觸發主線程彈窗并阻塞等待用戶響應 傳統信號槽實現 場景需求:在子線程執…

STM32學習之WWDG(原理+實操)

📢:如果你也對機器人、人工智能感興趣,看來我們志同道合? 📢:不妨瀏覽一下我的博客主頁【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸對你有幫助,可點贊 👍…

【端午安康】龍舟爭渡Plug-In

文章目錄 正文附錄A:關于Python的錄屏方法總結(來自DeepSeek的回答)1. 使用 pyautogui 和 OpenCV 錄制屏幕2. 使用 mss 庫(高效屏幕捕獲)3. 使用 PIL.ImageGrab 錄制屏幕4. 使用 Windows 原生快捷鍵錄制(非…

Apache SeaTunnel部署技術詳解:模式選擇、技巧與最佳實踐

Apache SeaTunnel(原Waterdrop)作為高性能、分布式數據集成平臺,支持海量數據的離線與實時同步。其靈活多樣的部署模式可適配不同規模的生產環境需求。本文將系統解析SeaTunnel的部署架構、技術要點及最佳實踐,幫助用戶高效構建穩定可靠的數據管道。 一、部署模式全景概覽 …

【機械視覺】Halcon—【六、交集并集差集和仿射變換】

【機械視覺】Halcon—【六、交集并集差集和仿射變換】 目錄 【機械視覺】Halcon—【六、交集并集差集和仿射變換】 介紹 交集并集差集介紹: 1. 交集(Intersection) 2. 并集(Union) 3. 差集(Difference&#xff…

實驗設計與分析(第6版,Montgomery)第5章析因設計引導5.7節思考題5.6 R語言解題

本文是實驗設計與分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅玨生譯) 第5章析因設計引導5.7節思考題5.6 R語言解題。主要涉及方差分析&#xff0c;正態假設檢驗&#xff0c;殘差分析&#xff0c;交互作用圖&#xff0c;等值線圖。 dataframe <-data.frame…

劍指offer15_數值的整數次方

數值的整數次方 實現函數 double Power(double base, int exponent) 題目要求 計算 base exponent \text{base}^{\text{exponent}} baseexponent&#xff1a; 不得使用庫函數不需要考慮大數問題&#xff0c;絕對誤差不超過 10 ? 2 10^{-2} 10?2不會出現底數和指數同為 0…

【Typst】1.Typst概述

概述 Typst是一種用于排版文檔的標記語言&#xff0c;可以用于排版各種精美的論文、文章、書籍、報告和作業等。它是LaTex的精神續作&#xff0c;但是運行環境和編譯速度都要更簡單、更快捷。 它設計了一種腳本結合簡單的標記語法實現復雜的排版效果。并且支持模板創建、文件…

[Java惡補day14] 56. 合并區間

以數組 intervals 表示若干個區間的集合&#xff0c;其中單個區間為 intervals[i] [starti, endi] 。請你合并所有重疊的區間&#xff0c;并返回 一個不重疊的區間數組&#xff0c;該數組需恰好覆蓋輸入中的所有區間 。 示例 1&#xff1a; 輸入&#xff1a;intervals [[1,3…

DiskGenius專業版v6.0.1.1645:分區管理、數據恢復、備份還原,一應俱全!

各位小伙伴&#xff0c;大家好&#xff01;今天阿燦給大家帶來一款超好用的分區工具&#xff0c;DiskGenius專業版。這款工具堪稱電腦管理界的“瑞士軍刀”&#xff0c;功能強大&#xff0c;現在出了新版本v6.0.1.1645&#xff0c;簡繁中文單文件便攜版&#xff0c;使用超方便。…

azure web app創建分步指南系列之二

為注冊表授權托管標識 你創建的托管標識尚未獲得從容器注冊表中提取數據的授權。在此步驟中,你將啟用授權。 返回容器注冊表的管理頁面: 在左側導航菜單中,選擇“訪問控制 (IAM)”。選擇“添加角色分配”。此屏幕截圖顯示了如何為容器注冊表啟用添加角色分配。在角色列表中…

STM32 AD單通道與多通道實戰指南

文章目錄 AD單通道&#xff08;實驗&#xff09;有關配置的庫函數AD單通道部分主要代碼 AD多通道實現多通道采集實現思路探討單次轉換非掃描模式實現AD多通道AD多通道部分代碼 學習建議&#xff1a;推薦搭配 江協科技 AD單通道 AD多通道一起食用&#xff01;&#xff01;&#…

溝通頻率不合適,如何找到平衡點

在團隊協作中&#xff0c;溝通頻率過高、信息干擾、節奏錯位常常導致效率下降與成員倦怠。PMI研究指出&#xff0c;溝通不當是75%項目延誤的根源&#xff0c;其中溝通頻率失衡是關鍵變量之一。要解決這一問題&#xff0c;關鍵在于設定節奏、分層溝通、制定協議。其中&#xff0…

EC2 實例詳解:AWS 的云服務器怎么玩???

彈性計算、靈活計費、全球可用&#xff0c;AWS EC2 全攻略 在 AWS 生態中&#xff0c;有兩個核心服務是非常關鍵的&#xff0c;一個是 S3&#xff08;對象存儲&#xff09;&#xff0c;另一個就是我們今天的主角 —— Amazon EC2&#xff08;Elastic Compute Cloud&#xff09…

lvs-keepalived高可用群集

目錄 1.Keepalived 概述及安裝 1.1 Keepalived 的熱備方式 1.2 keepalived的安裝與服務控制 &#xff08;1&#xff09;安裝keep alived (2)控制 Keepalived 服務DNF 安裝 keepalived 后,執行以下命令將keepalived 服務設置為開機啟動。 2.使用 Keepalived 實現雙機熱備 …

車載診斷架構SOVD --- 車輛發現與建連

我是穿拖鞋的漢子,魔都中堅持長期主義的汽車電子工程師。 老規矩,分享一段喜歡的文字,避免自己成為高知識低文化的工程師: 鈍感力的“鈍”,不是木訥、遲鈍,而是直面困境的韌勁和耐力,是面對外界噪音的通透淡然。 生活中有兩種人,一種人格外在意別人的眼光;另一種人無論…