大模型推理--從零搭建大模型推理服務器：硬件選購、Ubuntu雙系統安裝與環境配置

自從大模型火了之后就一直想自己組裝一臺機器去深入研究一下大模型，奈何囊中羞澀，遲遲也沒有行動。在下了很大的勇氣之后，終于花了接近4萬塊錢組裝了一臺臺式機，下面給大家詳細介紹一下我的裝機過程。

1.硬件配置

研究了一周，最終選擇了如下配置：
在這里插入圖片描述
我是在京東之家線下組裝的，花了38600，裝機沒收錢。不過小哥對裝Ubuntu不太懂，當天只給我安裝了windows 11，Ubuntu是回家之后我自己裝的。弄完之后跑了幾天感覺這個配置還不錯，對得起這個價格，可以分享給大家。
在這里插入圖片描述
CPU選擇了A卡的9950x3D，這個在CPU排名中還是非常靠前的，截至2025年5月4日性能僅次于AMD的線程撕裂者系列。它有16核32線程，但是用cat /proc/cpuinfo命令會直接顯示32個核心，所以可以簡單地認為它有32個邏輯核。顯卡我選擇了48G的4090，沒有選擇最新的32G 5090，主要原因是針對大模型推理來說顯存是最大的瓶頸，選擇顯卡肯定是顯存越大越好。此外，當下5090的溢價較為嚴重，沒必要去吃虧買性能，而且搞不好買個5090還會出現燒卡的問題。內存選擇了一個非主流的品牌金百達，但是單張內存條的容量可以到48G，兩張內存條就可以達到96G，這個對不少大模型任務來說足夠了。高通有些模型量化的任務需要80G以上的內存，所以64G內存還是少了點，建議大家配置內存時盡量都96G往上。
在這里插入圖片描述
介紹完三大件之后，其他的硬件中最關鍵的就是主板。我沒有選擇最高配置的主板，算是選擇了一個中等配置的。X870-PLUS可以安裝兩張顯卡，四張內存條，四塊SSD硬盤，所以給我留了一半的余量以作將來擴展。電源用的是1000w的，針對單顯卡是夠用了，如果升級成雙4090就不夠了，考慮到一會半會也沒錢去升級雙顯卡，所以暫時就用1000w電源。硬盤選擇了三星PCIe 4.0協議的2T固態硬盤，拷貝速度不是最快但是也挺快的，不過用了幾天發現2T還是太少了，Ubuntu下download大模型以及裝各種軟件硬盤用得超快，我感覺最少4T用著才會有安全感。
雖然用了一段時間感覺還不錯，但是我覺得當前配置尚未達到理想狀態，以下是我實際體驗感覺還有改進空間的地方：

選擇的散熱液晶屏稍微有點大，安裝上之后就會輕微擠壓內存條一號槽，所以不知道安上四張內存條之后會不會有問題，建議水冷散熱選擇屏幕較小一點的；
選擇的主板雖然可以裝雙顯卡，但是在單顯卡情況下就出現了顯卡的風扇與機箱下部的風扇對吹的情況，目前還沒有出現顯卡溫度過高的問題，但總感覺風扇對吹是很不好的搭配。要是搭配雙顯卡，風扇對吹就會更嚴重，可能會對顯卡散熱帶來不利影響。所以大家在選擇主板和機箱的時候看看能否避免風扇對吹這個問題；
電源1000w應該無法支持雙4090顯卡。如果要安裝雙4090，電源最好選擇1600w的；
華碩這個X870-PLUS主板默認沒有啟用內存超頻，所以內存的速度只有4800MT/s，這個與DDR5內存的宣傳相比還是弱了一些，不知道超頻之后內存是否會出問題，有待后續進一步驗證；
也不知道是什么原因，windows 11下藍牙無法使用，也不知道是哪個地方出了問題；
安鈦克Flux Pro這個機箱不能算是靜音機箱，機箱本身有6個風扇，加上水冷的3個風扇，運行起來還是能比較明顯地感受到噪音，如果對聲音敏感的人建議上更高級的機箱。

2.Ubuntu雙系統安裝

下面開始介紹操作系統的安裝，windows 11是京東小哥幫忙裝的，Ubuntu是我自己裝的，所以重點關注Ubuntu的安裝。不過在安裝windows 11的時候也遇到了一個配置問題，花了倆小時才搞明白，當裝系統時提示下面的問題時，要輸入Y，不要輸入N，否則就無法安裝windows系統。
在這里插入圖片描述
安裝完Windows之后還有一步建議的操作，就是要給Ubuntu系統劃分一個獨立的盤。通過Win+X打開磁盤管理，然后將一個windows下不使用的盤符右鍵刪除卷留給Ubuntu備用。當然也可以不執行這一步刪除操作，在安裝Ubuntu時再刪除也行。具體要留多少空間給Ubuntu系統看你的需求，我一開始留了500G，結果用了一天就明顯感覺不夠用，被迫無奈又重裝了一次Ubuntu系統，建議給Ubuntu留至少1T的空間。

2.1 制作Ubuntu鏡像

之前裝雙系統都是用同事的U盤，這次我決定自己來整一個。起初以為制作一個鏡像是很難的事情，用DeepSeek一問才知道這個事簡單到不能再簡單了。首先從官網下載最新版的Ubuntu 22.04.5。這里切記要用22.04.5版本，不要用22.04.3或者22.04.4，否則可能會導致安裝完成之后有線和無線均無法上網的問題，后續壓根無法開展任何工作。我沒有考慮24.04，因為這個版本的系統問題很多。
有了鏡像文件之后，還需要一個至少8G空間的U盤，我們需要將U盤做成可以啟動的引導盤。方法很簡單，按照以下流程來即可：

下載并運行Rufus[from https://rufus.ie/zh/]（便攜版無需安裝）；
插入U盤，Rufus會自動識別（確保選擇正確的設備）；
點擊選擇按鈕，找到下載的Ubuntu 22.04.5 ISO文件；
分區類型：
舊電腦：MBR + BIOS（或UEFI-CSM）
新電腦：GPT + UEFI（非CSM，選擇這個就行）
文件系統：FAT32（默認）；
點擊開始 → 確認警告（會格式化U盤）→ 等待完成。

2.2 安裝Ubuntu系統

做好鏡像之后開始進入真正的安裝環節。針對X870-PLUS主板，在啟動電腦的時候通過按F2或者Del進行BIOS界面，然后選擇從U盤啟動進入Ubuntu安裝界面。絕大多數步驟都是選擇下一步即可，但是有一步需要特別注意，就是要選擇將Ubuntu安裝在哪個盤，以及如何劃分分區的問題。在安裝到下圖時，要選擇第三個選項something else，
在這里插入圖片描述
這樣就可以允許我們將Ubuntu安裝到我們指定的位置，并進行合理的空間劃分。點擊Install Now之后進入下圖，下圖應該是安裝Ubuntu時最復雜的步驟了。

需要我們將一塊windows下刪除的盤符，現在顯示為free space的分區進行更細致的劃分（如果沒有free space的分區那就是我們沒有在Windows下刪除某個盤符，需要我們選擇要安裝的分區然后點擊減號進行刪除）。后續的分區我參考了豆包的建議，劃分成了4部分：

創建EFI系統分區：若磁盤為GPT分區表格式，需創建EFI系統分區。右鍵點擊未分配空間，選擇“新建分區” ，設置分區大小200 - 500MB左右，“用于”選擇“EFI System Partition” 。我設置了500M，后續的boot loader也選擇該分區；
創建根分區（/）：再次右鍵點擊剩余未分配空間，選“新建分區” ，設置較大空間，“用于”選“ext4日志文件系統” ，“掛載點”選“/” 。我選擇了500G。這部分空間會被安裝的軟件以及docker鏡像等系統軟件占用，建議大一點；
創建交換分區（可選）：若電腦內存較小（如小于8GB），可創建交換分區。右鍵未分配空間選“新建分區” ，大小一般設為內存1 - 2倍，“用于”選“swap area” 。我選擇了64G。這塊可能影響不大，自行決定；
創建/home分區（可選）：想單獨管理個人數據，可再分空間創建/home分區。右鍵未分配空間選“新建分區” ，“用于”選“ext4日志文件系統” ，“掛載點”選“/home” 。我給該分區也留了500G空間，這個分區用來放自己的資源，比如大模型權重，非root下pip安裝的軟件等。Home分區是平時工作的分區，但是我們后續可以通過添加新的硬盤來增大空間，所以預留500G暫時夠用。但是根分區我也不知道咋通過增加硬盤的方式來擴大空間，所以最好一開始就給根分區留足空間。

完成分區劃分之后，點擊continue等待安裝完成。

3.Ubuntu環境配置

完成安裝之后，首次啟動會出現下述界面：
在這里插入圖片描述
其中，Windows Boot Manager就是windows系統。此時，如果直接按Enter進行Ubuntu系統有可能會卡死，如果卡死就進入Advanced options for Ubuntu，然后通過recovery方式點擊resume進入了Ubuntu系統。第二次的時候就可以正常進入系統了。進入系統之后，我們就需要安裝一系列的軟件完成Ubuntu環境的配置。

3.1 基礎軟件的安裝

執行下述命令安裝一些基礎軟件：

sudo apt update
sudo apt install vim
sudo apt install pip
sudo apt install cmake
sudo apt install htop
sudo apt install curl
sudo apt install libcurl4-openssl-dev
sudo apt install dos2unix

上面這些軟件可以按需安裝，主要是先安裝vim編輯軟件以及pip python包安裝軟件。

3.2 docker環境配置

執行下述命令配置docker環境：

sudo apt install docker.iodistribution=$(. /etc/os-release;echo $ID$VERSION_ID) \&& curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \&& curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update   
sudo apt-get install -y nvidia-docker2
sudo systemctl restart docker

執行完上述命令之后就可以通過docker pull來抓取鏡像。

3.3 cuda環境配置

首先從nvidia官網下載最新的cuda驅動：cuda_12.8.1_570.124.06_linux.run。正常情況下我們可以通過sh運行上面的腳本安裝驅動和cuda，但是可能會遇到很多問題，現在有一種更簡單的方式。我們可以通過Ubuntu software updates中的Additional Drivers來安裝最新版的驅動，如下圖所示。
在這里插入圖片描述
安裝完驅動之后，我們再通過sh cuda_12.8.1_570.124.06_linux.run來安裝cuda。在安裝過程中我們把安裝驅動的選項取消掉即可。完成之后再通過如下命令配置PATH和LD_LIBRARY_PATH：

vim ~/.bashrc
export PATH=$PATH:/usr/local/cuda-12.8/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.8/lib64/

接著我們再從nvidia官網下載最新版的cudnn cudnn-local-repo-ubuntu2204-9.8.0_1.0-1_amd64.deb，按照下述命令完成cudnn的安裝：

sudo dpkg -i cudnn-local-repo-ubuntu2204-9.8.0_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2204-9.8.0/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudnn

執行完上述所有步驟，我們基本完成了整個環境的搭建，后續就可以正式開始搞大模型推理了。

3.4 大模型推理環境配置

我們可以通過pip安裝modelscope命令，然后利用modelscope download --model Qwen/Qwen3-8B下載最新的Qwen3大模型等。有了大模型之后，我們還可以選擇vllm或者sglang等推理框架進行部署。vllm可以通過pip install vllm來安裝。如此就完成了大模型推理服務器的配置~