前置工作
本地部署大模型的基本概念和前置工作-CSDN博客
模型部署
這里通過docker容器進行部署。我這里是h20*8,部署deepseek-v3-0324,這個配置和模型都比較大,大家根據自己的硬件對應調整
步驟一
我們要通過sglang部署模型,先拉取sglang的docker鏡像,這里下載失敗的話就考慮調整docker的鏡像源:
docker pull lmsysorg/sglang:latest
步驟二
通過modelscape下載模型到本地
modelscape模型介紹