linux安裝ollama

倆種方式都可


一、linux通過docker安裝ollama鏡像

1.下載安裝ollama鏡像

# 安裝 Docker
sudo yum install docker
sudo systemctl start docker#docker查看所有容器
docker ps -a  # 查看所有容器# docker查看指定容器
docker ps -a |grep ollama# 創建模型存儲目錄(例如 /data/ollama_models)
sudo mkdir -p /data/ollama_models
sudo chmod -R 777 /data/ollama_models  # 確保容器有寫入權限# 啟動容器并掛載目錄
docker run -d \--name ollama \-v /data/ollama_models:/root/.ollama \  # 將主機目錄掛載到容器內-p 11434:11434 \ollama/ollama#修改默認模型存儲路徑
如果不想掛載 /root/.ollama,可通過環境變量指定其他路徑:
docker run -d \--name ollama \-v /custom/models:/data/ollama_models \  # 自定義掛載點-e OLLAMA_MODELS=/data/ollama_models \   # 指定容器內路徑-p 11434:11434 \ollama/ollama# 停止容器
docker stop ollama# 啟動
docker start ollama# 重啟動
docker restart ollama#如果ollama正在運行并且不需要ollama了,刪除
docker stop ollama && docker rm ollama

2.檢查目錄掛載 (-v) 是否生效?

#檢查目錄掛載 (-v) 是否生效
方法 1:使用 docker inspect 查看掛載信息
docker inspect ollama | grep -A 5 Mounts方法2:
# 進入容器內部
docker exec -it ollama bash# 查看目錄是否存在
ls -l /data/ollama_models# 嘗試創建測試文件(驗證寫入權限)
touch /data/ollama_models/test.txt
exit# 返回主機檢查文件是否同步
ls -l /custom/models/test.txt

3.?檢查環境變量 (-e) 是否生效

方法 1:使用 docker inspect 查看環境變量
docker inspect ollama | grep -A 10 Env
預期輸出
"Env": ["OLLAMA_MODELS=/data/ollama_models","PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin"
]方法 2:在容器內打印環境變量
docker exec -it ollama sh -c 'echo $OLLAMA_MODELS'
預期輸出/data/ollama_models

4.下載大模型

進入容器內操作或直接通過 REST API 下載模型:

方法 1:進入容器內操作??

大模型占用內存一般較高,最好查一下電腦配置是否能帶動大模型

docker exec -it ollama ollama pull llama2  # 下載 llama2 模型

模型會自動保存到掛載的目錄?/data/ollama_models

方法 2:通過主機直接調用
curl -X POST http://localhost:11434/api/pull -d '{"name": "llama2"}'

5. 驗證模型下載

# 查看已下載模型
docker exec -it ollama ollama list# 檢查主機目錄內容
ls /data/ollama_models/models

6. 運行模型

# 在容器內交互式運行
docker exec -it ollama ollama run llama2# 通過 API 調用
curl http://localhost:11434/api/generate -d '{"model": "llama2", "prompt": "你好"}'

二、linux本地安裝ollama

1. 下載并安裝 Ollama

# 下載 Ollama
curl -fsSL https://ollama.com/install.sh | sh# 啟動 Ollama 服務
sudo systemctl enable ollama
sudo systemctl start ollama#停止ollama服務
sudo systemctl stop ollama

2. 設置環境變量指定模型目錄

默認情況下,Ollama 會將模型存儲在?~/.ollama?目錄。要更改此位置:

# 創建新的模型存儲目錄(例如 /data/ollama_models)
sudo mkdir -p /data/ollama_models
sudo chown -R $USER:$USER /data/ollama_models# 設置環境變量(臨時生效)
export OLLAMA_MODELS=/data/ollama_models# 使環境變量永久生效
echo "export OLLAMA_MODELS=/data/ollama_models" >> ~/.bashrc
source ~/.bashrc

3. 重啟 Ollama 服務使更改生效

sudo systemctl restart ollama

4. 驗證安裝并下載模型

# 檢查服務狀態
systemctl status ollama# 下載模型(會自動保存到指定目錄)
ollama pull llama2# 運行模型
ollama run llama2

5. (可選) 修改 systemd 服務文件永久設置

如果通過環境變量不生效,可以修改服務文件:sudo vi /etc/systemd/system/ollama.service
在?[Service]?部分添加:Environment="OLLAMA_MODELS=/data/ollama_models"
然后重新加載并重啟服務:sudo systemctl daemon-reload
sudo systemctl restart ollama

6.查看ollama日志
?

1. 查看詳細日志
首先獲取更詳細的錯誤信息:sudo journalctl -u ollama -n 50 --no-pager
或直接運行 Ollama 查看輸出:sudo /usr/local/bin/ollama serve

7. 檢查?ollama?用戶是否存在

運行以下命令檢查用戶和組是否已創建:id ollama  # 檢查用戶是否存在
grep ollama /etc/group  # 檢查用戶組是否存在如果不存在,可以手動創建:
sudo useradd -r -s /bin/false ollama  # 創建系統用戶(無登錄權限)

注意事項:

    1. 確保指定的目錄有足夠的存儲空間

    2. 目錄權限要正確,Ollama 進程需要有讀寫權限

    3. 不同版本的 Ollama 可能有不同的配置方式

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/76465.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/76465.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/76465.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redis 學習目標

🎯 Redis 學習目標(開發者視角) ? 一、學習完成后能掌握的核心能力: 分類具體內容📦 基礎能力熟練掌握 Redis 五大數據結構(String、List、Hash、Set、ZSet),會用也會選對場景&am…

gerrit配置及使用git-lfs

gerrit服務器端配置 下載git-lfs插件 登錄Dashboard [Jenkins] (gerritforge.com),下載對應版本的插件 配置gerrit 將下載的lfs.jar插件放到${GERRIT_SITE}/plugins/下面為所有倉庫啟用git-lfs 此步驟需要修改 All-projects 倉庫配置,步驟如下 1、克隆倉…

深入理解 Linux PATH 環境變量:配置與優化!!!

深入理解 Linux PATH 環境變量:配置與優化 🚀 歡迎來到 Linux 環境變量的奇妙世界!今天我們來聊聊那個讓命令行如魚得水的幕后英雄——PATH 環境變量!😎 通過這篇博客,你將學會如何配置它、優化它&#xff…

如何在AMD MI300X 服務器上部署 DeepSeek R1模型?

DeepSeek-R1憑借其深度推理能力備受關注,在語言模型性能基準測試中可與頂級閉源模型匹敵。 AMD Instinct MI300X GPU可在單節點上高效運行新發布的DeepSeek-R1和V3模型。 用戶通過SGLang優化,將MI300X的性能提升至初始版本的4倍,且更多優化將…

簡化DB操作:Golang 通用倉庫模式

介紹 本代碼包提供一個用于數據庫操作的通用倉庫 (GenericRepository),利用 Golang 和 GORM (Go ORM) 實現。該倉庫設計用于簡化數據庫的 CRUD (創建、讀取、更新、刪除) 操作,支持批處理、沖突處理、分頁查詢等高級功能。 主要功能 創建記錄 (Create…

JavaWeb 課堂筆記 —— 08 請求響應

本系列為筆者學習JavaWeb的課堂筆記,視頻資源為B站黑馬程序員出品的《黑馬程序員JavaWeb開發教程,實現javaweb企業開發全流程(涵蓋SpringMyBatisSpringMVCSpringBoot等)》,章節分布參考視頻教程,為同樣學習…

雙引擎驅動:解密音視頻體驗的QoS技術底座與QoE感官革命

QoS 定義:QoS(Quality of Service,服務質量)衡量音視頻傳輸技術層面的性能表現,聚焦網絡傳輸和系統處理能力,通過客觀指標量化服務質量。核心指標 碼率/帶寬:數據傳輸速率上限,直接…

Stable Diffusion + Contronet,調參實現LPIPS最優(帶生成效果+指標對比)——項目學習記錄

目錄 前言 一、數據集:圖像文本,部分選取于DeepFashion 二、優化一,img2img 三、優化二,微調sd參數 四、優化三,dreamshaper優化 五、優化四,sdv1.5contronet 六、問題探索歷程 1. 從 SDXL 到輕量化模…

SQL 不走索引的常見情況

在 SQL 查詢中&#xff0c;即使表上有索引&#xff0c;某些情況下數據庫優化器也可能決定不使用索引。以下是常見的不走索引的情況&#xff1a; 1. 使用否定操作符 NOT IN ! 或 <> NOT EXISTS NOT LIKE 2. 對索引列使用函數或運算 -- 不走索引 SELECT * FROM user…

數據庫主從延遲全解析:原因、影響與解決之道

目錄 一、引言&#xff1a;理解數據庫主從架構 二、數據庫主從延遲的定義與測量 2.1 主從延遲的技術定義 2.2 如何測量主從延遲 2.3 主從延遲對系統的影響 三、主從延遲的常見原因分析 3.1 網絡延遲因素 3.1.1 網絡質量與帶寬限制 3.1.2 地理位置分布造成的延遲 3.2 …

分治-歸并系列一>翻轉對

目錄 題目&#xff1a;解析&#xff1a;策略一&#xff1a; 代碼&#xff1a;策略二&#xff1a; 代碼&#xff1a; 題目&#xff1a; 鏈接: link 這題和逆序對區別點就是&#xff0c;要找到前一個元素是后一個元素的2倍 先找到目標值再&#xff0c;繼續堆排序 解析&#xff1…

從0到1打造一套適合自己接單的腳手架05自動化創建表

上一篇我們是手動創建的表&#xff0c;感覺不方便&#xff0c;后續如果要做成產品在部署的時候一個個的創建表太麻煩了&#xff0c;我們讓ai來自動創建表&#xff0c;輸入如下提示詞 現在這種單獨去navicate執行也不方便&#xff0c;我希望是有一個目錄里存放的表結構的語句&a…

minio改成https+域名訪問

思路有兩個&#xff1a; 方式一&#xff1a;通過nginx反向代理&#xff0c;將https配置在nginx&#xff0c;內部的MinIO還是使用HTTP&#xff1b;方式二&#xff1a;MinIO服務端直接配置成HTTPS&#xff1b; 注意&#xff1a; 私鑰需要命名為&#xff1a;private.key 公鑰需要…

VS Code構建C/C++開發環境(Windows with MinGW and CMake)

文章目錄 目的編譯工具鏈基礎開發與調試基于CMake開發與調試關于settings.json總結 目的 在Windows上進行C/C開發目前最最常用的IDE就是微軟的 Visual Studio &#xff0c;只是對我來說早些年的VS實在是太卡了&#xff0c;留下了不好的印象。后來沒怎么用過&#xff0c;現在下…

一組可能的機器學習問題列表

線性回歸與多項式擬合的關系最小二乘法在機器學習中的應用梯度下降是如何實現的貝葉斯分類器的應用場景高斯分布與判定在哪里用到模型的評估有哪些參數誤差中的偏差和方差定義訓練集分組的快捷方式如何度量模型性能查準率查全率的定義roc,aux的含義正則化是什么意思k均值用來解…

linux下io操作詳細解析

在 Linux 系統下&#xff0c;IO&#xff08;輸入/輸出&#xff09;操作是程序與外部設備&#xff08;如文件、網絡等&#xff09;交互的重要方式。Linux 提供了豐富的系統調用和庫函數來支持各種 IO 操作。以下是對 Linux 下 IO 操作的詳細解析&#xff0c;包括文件 IO、網絡 I…

wsl2+ubuntu22.04安裝blender教程(詳細教程)

本章教程介紹,如何在Windows操作系統上通過wsl2+ubuntu安裝blender并運行教程。Blender 是一款免費、開源的 ??3D 創作套件??,廣泛應用于建模、動畫、渲染、視頻編輯、特效制作等領域。它由全球開發者社區共同維護,支持跨平臺(Windows、macOS、Linux),功能強大且完全…

目標檢測YOLO實戰應用案例100講- 基于卷積神經網絡的小目標檢測算法研究與應用

目錄 知識儲備 基于改進YOLOv5的小目標檢測算法 一、環境配置(Python 3.8+) 二、核心代碼實現 1. 改進模型定義(models/yolov5s_tiny.py ) 2. 小目標數據增強(datasets/tiny_aug.py ) 3. 訓練腳本(train.py ) 三、關鍵改進點說明 四、實驗配置建議 前言 傳統…

智能DNS解析:解決高防IP地區訪問異常的實戰指南

摘要&#xff1a;針對高防IP在部分地區無法訪問的問題&#xff0c;本文設計基于智能DNS的流量調度方案&#xff0c;提供GeoDNS配置與故障切換代碼示例。 一、問題背景 運營商誤攔截或線路波動可能導致高防IP在福建、江蘇等地訪問異常。傳統切換方案成本高&#xff0c;智能DNS可…

根據 PID 找到對應的 Docker 容器

引言 在日常運維與調試過程中&#xff0c;我們常常需要查找某個進程所屬的 Docker 容器。當系統出現問題或資源異常時&#xff0c;根據進程的 PID 找到其所屬容器可以幫助我們迅速定位問題。本文將介紹如何利用 Linux 的 cgroup 機制&#xff0c;以及 Docker 提供的工具來完成…