? ? ? ? 首先介紹下ollama是什么?Ollama是一個開源的大型語言模型服務工具,旨在為用戶提供本地化的運行環境,滿足個性化的需求。具體來說,Ollama是一個功能強大的開源框架,可以簡化在Docker容器中部署和管理大型語言模型(LLM)的過程,使得用戶能夠快速地在本地計算機上運行大型語言模型,如Llama 2等。此外,Ollama還提供了類似OpenAI的API接口和聊天界面,方便用戶部署和使用。總的來說,Ollama可以幫助用戶實現大型語言模型的本地化運行,從而滿足用戶對于語言處理任務的個性化需求。
? ? ? ? 下面開始下載和安裝,下載的話可以到ollama的官網去下載,有window,macOS,liunx三個版本,下載鏈接
點擊下載后等待下載完成,然后會得到一個exe文件:
雙擊此exe,點擊Install直接開始安裝,
????????安裝完畢后,點擊window下面的狀態欄會看到有ollama的標志,就是剛才exe一樣的標識,此時ollama就在運行中了。也可以打開命令提示符窗口,輸入ollama list,這個命令是查看已經下載的大模型,因為我這里是剛安裝所以是空的:
????????ollama只是一個大模型的服務工具,并非大模型本體,所以只是安裝ollama也并不能使用大模型,所以接下來要通過ollama下載大模型,需要注意的是,llama3分為多個版本,如果你的電腦性能一般還是安裝llama3:8B的版本,除非是很好的電腦,內存64以上,GPU 3090的那種才考慮安裝llama3:70B,下面是根據電腦配置推薦的安裝版本
RAM:Llama 3 8B至少16GB,Llama 3 70B至少64GB或更多。
GPU:Llama 3 8B具有至少8GB VRAM的強大GPU,Llama 3 70B最好是支持CUDA的NVIDIA GPU。
磁盤空間:Llama 3 8B約為5GB,而Llama 3 70B超過20GB
這類以下載ollama3為例,在命令提示符窗口輸入:
ollama run llama3
?這里使用run命令就可以直接下載llama3了,然后等待下載完成。如下圖就是下載完成,可以直接在這里提問了,
不過llama3對英文支持更好,可以用英文進行提問,英文不好的話也可以要求它用英文回答。
至此,用ollama部署一個離線的llama3大模型就好啦。