# 設置環境變量并啟動模型
export CUDA_VISIBLE_DEVICES=0,1,2,3
export OLLAMA_SCHED_SPREAD=1 ?# 啟用多卡負載均衡
ollama run deepseek-r1:32b
若?deepseek-r1:32b
?的顯存需求未超過單卡容量(如單卡 24GB),Ollama 不會自動啟用多卡
在run一個8b的就可以看出來多卡了?
# 設置環境變量并啟動模型
export CUDA_VISIBLE_DEVICES=0,1,2,3
export OLLAMA_SCHED_SPREAD=1 ?# 啟用多卡負載均衡
ollama run deepseek-r1:32b
若?deepseek-r1:32b
?的顯存需求未超過單卡容量(如單卡 24GB),Ollama 不會自動啟用多卡
在run一個8b的就可以看出來多卡了?
本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。 如若轉載,請注明出處:http://www.pswp.cn/pingmian/81550.shtml 繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81550.shtml 英文地址,請注明出處:http://en.pswp.cn/pingmian/81550.shtml
如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!