【Ollama】open-webui部署模型

目錄

一、本地部署Ollama

1.1 進入官網復安裝命令

1.2 執行安裝命令

?1.3 驗證是否安裝成功

二、啟動Ollama服務

三、運行模型

方法一:拉取模型鏡像

方法二:拉取本地模型

四、使用Open WebUI 部署模型

4.1 創建虛擬環境

4.2 安裝依賴

4.3?運行 open-webui

4.4 啟動瀏覽器



前言

安裝前說明

?本教程主要演示的是Linux環境部署


一、本地部署Ollama

1.1 進入官網復制安裝命令

Ollama官網:Ollama

說明:個人電腦顯存如果低于16GB不推薦安裝,因為跑不動模型,可以去租服務器。

以下是部署在服務器Linux環境下部署的。

?

▲因為部署的環境是Linux,這里選擇Linux的安裝命令;

▲復制命令,在服務器的數據盤中安裝

curl -fsSL https://ollama.com/install.sh | sh


1.2 執行安裝命令

在服務器的數據盤中運行

說明:不同服務器的數據盤會有所不同,這里一定得選好適合自己的。?


?1.3 驗證是否安裝成功

#查看Ollama版本
ollama --version

?顯示樣例:?


二、啟動Ollama服務

#啟動Ollama服務
ollama serve

顯示樣例:?

說明:ollama運行后會在本地端口暴露一個 openai API 服務,我們后面使用 open-webui 來連接就可以了。


三、運行模型

3.1 方法一:拉取ollama模型鏡像

#拉取在線模型deepseek-r1:1.5b
ollama run deepseek-r1:1.5b

拉取成功后可以直接和大模型進行對話。

??

(可選)選擇模型:這里選擇deepseek-r1:1.5b

要下載那個模型,點進去就有它的安裝命令;?


3.2? 方法二:拉取本地模型

前提要求:本地需要要一個gguf格式的模型,可以去魔塔社區或Huggingface上下載;

這里以魔塔社區為例:

可以搜索gguf后綴的模型下載現成的

3.2.1 選擇模型

這里我選擇一個已經訓練后,轉成gguf個格式的模型【Qwen2.5-7B-Instruct-f16.gguf】。


3.2.2?創建ModelFile

創建一個 Ollama 模型的 meta 文件(ModelFile),目的是讓 Ollama 能加載你本地的 GGUF 文件。

1、選擇創建ModelFile的路徑

#進入模型路徑
cd /mnt/workspace/model/qwen

/mnt/workspace/model/qwen:表示我存放模型文件的路徑,這里選擇自己存放模型的路徑即可。

2、創建一個名為 Modelfile 的文件

nano Modelfile

或者用 vi

vi Modelfile

按“i”寫入以下內容。復制模型路徑,寫入以下內容,創建名為“ModelFile”的meta文件,內容如下:

#GGUF文件路徑
FROM /mnt/workspace/model/qwen/Qwen2.5-7B-Instruct-q8_0.gguf

說明:/mnt/workspace/model/qwen/Qwen2.5-7B-Instruct-q8_0.gguf:表示轉換為gguf格式的模型路徑。

【說明】

成功寫入后,會在當前目錄下創建一個Modelfile的文件


3.2.3?創建自定義模型?

使用ollama create命令創建自定義模型

ollama create qwen2.5-7b-f16 -f ./Modelfile

qwen2.5-7b-f16:表示注冊進Ollama的自定義模型名稱;

./Modelfile:表示上一步創建的Modelfile文件路徑;

這會把模型注冊進 Ollama 的本地模型庫,名字叫 qwen2.5-7b-f16


3.2.4 查看是否注冊成功
ollama list


四、使用Open WebUI 部署模型

open webui適合小型快速的應用做部署,但在現階段這個框架是存在一定缺陷的:不適合微調之后的模型,在【三、運行模型】這一步介紹了2種方法,一種是直接從Ollama中拉取模型,一種則是訓練后的gguf格式的模型文件。經過測試,直接在Ollama上拉取的模型可以正常去做一些回答,而微調后的模型拉取到Ollama上,會不停地輸出內容

4.1 創建虛擬環境

#創建虛擬環境
conda create -n ollama-open-webui python=3.11#激活虛擬環境
conda create -n ollama-open-webui
這里選用 python 3.11 版本是因為 open-webui 的要求,一定要根據官方指定的python版本,不然后面安裝依賴過程中可能會報錯。
倉庫:https://github.com/open-webui/open-webui
文檔:https://docs.openwebui.com/

4.2 安裝依賴

pip install -U open-webui

注意:這里安裝的過程會比較長,耐心等待;


4.3?運行 open-webui

# 激活名為 open-webui 的 Conda 環境
conda activate open-webui  # 設置 Hugging Face 模型倉庫的鏡像地址為 https://hf-mirror.com,通常用于加速從 Hugging Face 下載模型
export HF_ENDPOINT=https://hf-mirror.com  # 啟用 Ollama API 服務,這可能意味著啟動本地 Ollama 服務用于與模型交互
export ENABLE_OLLAMA_API=True  # 設置 OpenAI API 的本地基礎 URL,使其指向本地服務 (127.0.0.1:11434),通常用于連接 OpenAI 的代理或自定義接口
export OPENAI_API_BASE_URL=http://127.0.0.1:11434/v1  # 啟動 open-webui 服務,通常是啟動一個 Web 界面應用來訪問模型、進行交互或查看結果
open-webui serve

這里會生成一個文件.webui_secret_key;


【注意】

執行open-webui server后,可能時間會比較長,只要沒報錯就耐心等待;

簡單總結:

  1. 激活 Conda 環境:確保你正在使用特定的 Conda 環境 (open-webui) 來運行應用。

  2. 設置鏡像和 API 配置:通過環境變量配置模型下載源 (HF_ENDPOINT) 和啟用本地服務(ENABLE_OLLAMA_API)以及設置 API 基礎 URL(OPENAI_API_BASE_URL)。

  3. 啟動服務:最后通過 open-webui serve 啟動 Web 服務,通常是一個用來與模型交互的界面。


4.4 啟動瀏覽器

一切運行正常后,可以通過瀏覽器輸入 http://127.0.0.1:8080 打開 open-webui 面板進行使用。如果部署在遠程服務器則需要把 127.0.0.1 改成對應的 ip 地址(并考慮防火墻問題)。
關于后臺持續運行服務,可以使用 tmux/screen/systemd 工具或者 nuhup ... & 等方法,網上教程非常多,本文在此不敘述。
▲啟動后,需要創建管理員賬號
▲確認開始使用

▲進入對話頁面

▲進行對話

切換模型,可以發現注冊進ollama的模型都在這里,可以根據需求選擇增加想要的模型。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/92608.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/92608.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/92608.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C#文件操作(創建、讀取、修改)

判斷文件是否存在 不存在則創建默認文件 并寫入默認值/// <summary>/// 判斷文件是否存在 不存在則創建默認文件 并寫入默認值/// </summary>public void IsConfigFileExist(){try{// 獲取應用程序的當前工作目錄。string fileName System.IO.Directory.GetCurr…

基于阿里云平臺的文章評價模型訓練與應用全流程指南

基于阿里云平臺的文章評價模型訓練與應用全流程指南 前些天發現了一個巨牛的人工智能學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家&#xff0c;覺得好請收藏。點擊跳轉到網站。 1. 項目概述 1.1 項目背景 在當今信息爆炸的時代&…

AI 及開發領域動態與資源匯總(2025年7月24日)

AI 項目、工具及動態匯總 項目/產品名稱核心功能/簡介主要特點/亮點相關鏈接Supervision一個流行的計算機視覺工具庫&#xff0c;用于加速計算機視覺應用的構建。模型無關&#xff0c;可與多種主流庫集成&#xff1b;提供豐富的可定制標注工具&#xff1b;支持多種數據集操作和…

C專題8:文件操作1

1.C語言中的文件是什么?所謂文件&#xff08;file&#xff09;一般指存儲在外部介質上數據的集合&#xff0c;比如我們經常使用的txt、bmp、jpg、exe、rmvb等等。這些文件各有各的用途&#xff0c;我們通常將它們存放在磁盤或者可移動盤等介質中。文件無非就是一段數據的集合&…

Opencv C# 重疊 粘連 Overlap 輪廓分割 (不知道不知道)

先上效果圖一種基于凹陷檢測重疊輪廓分割的方法這兩個星期壓力大的一批&#xff0c;心臟都給干得亂跳了&#xff0c;現在高血壓心率不齊貧血。兄弟們保重身體啊。簡單說下邏輯&#xff1a;前處理&#xff1a;的噼里啪啦我就不說了&#xff0c;根據樣品來(灰度&#xff0c;濾波&…

CentOS7 安裝 rust 1.82.0

CentOS7 安裝 rust 1.82.0 我在CentOS7.9中安裝rust遇到報錯版本低&#xff0c;再升級版本的過程中遇到諸多問題&#xff0c;簡單記錄。 遇到的問題 提示版本低 centos7 安裝 ERROR: Rust 1.75.0 or newer required.Rust version 1.72.1 was found.原因是 CentOS7 的默認的軟件…

Compose 適配 - 鍵鼠模式

一、概念不止觸摸交互&#xff0c;在 ChromeOS 或外接鍵鼠的設備上&#xff0c;需要考慮焦點、懸停、右鍵等操作邏輯。二、使用2.1 焦點使用 Tab 鍵來導航&#xff0c;改變邊框以提供清晰的焦點指示器。Composable fun Demo() {val interactionSource remember { MutableInter…

征服 Linux 網絡:核心服務與實戰解析

在當今的IT基礎設施中&#xff0c;Linux作為服務器操作系統的基石&#xff0c;其強大的網絡功能是其不可或缺的優勢。對于任何志在成為高級系統管理員或運維工程師的人來說&#xff0c;精通Linux網絡配置與服務管理是核心競爭力。 與日常應用不同&#xff0c;Linux網絡管理往往…

Spark 之 DataFrame

# foreach useFeatureDF.rdd.foreachPartition {iter => iter.foreach {row =>val userId = row.getAs[Int]

射頻信號(大寬高比)時頻圖目標檢測anchors配置(下)

書接上文&#xff1a; 射頻信號&#xff08;大寬高比&#xff09;時頻圖目標檢測anchors配置&#xff08;上&#xff09; 三、4090加成檢測效果深度優化 在4090 24G專用顯存加持下繼續探究大寬高比目標檢測的奧秘&#xff1a; Conda環境遷移至租的云服 在云服上第一次測試…

跨境支付入門~國際支付結算(區塊鏈篇)

摘要Web3區塊鏈技術架構解析&#xff1a;從底層共識到應用生態本文系統梳理了Web3作為穩定幣基礎設施的技術架構&#xff0c;采用"數字共和國"的比喻框架&#xff0c;將區塊鏈技術分解為六大核心模塊&#xff1a;憲法根基&#xff08;區塊鏈層&#xff09;&#xff1…

Docker 私服

什么是 Docker 私服&#xff1f; Docker 官方的 Docker Hub 是一個用于管理公共鏡像的倉庫&#xff0c;我們可以從上面拉取鏡像 到本地&#xff0c;也可以把我們自己的鏡像推送上去。 但是&#xff0c;有時候我們的服務器無法訪問互聯網&#xff0c;或者你不希望將自己的鏡像…

DeepSeek vs ChatGPT:誰更勝一籌?

新興 AI 聊天機器人的崛起與挑戰&#xff1a;對話模型發展觀察近年來&#xff0c;生成式人工智能領域持續取得突破&#xff0c;聊天機器人作為其中的代表&#xff0c;廣泛應用于寫作、編程、問答和信息處理等任務。2025 年初&#xff0c;國內某 AI 團隊宣布了多項模型技術進展&…

飛算科技:以原創技術為翼,賦能產業數字化轉型

在數字經濟浪潮席卷全球的當下&#xff0c;一批專注于技術創新的中國企業正加速崛起&#xff0c;飛算數智科技&#xff08;深圳&#xff09;有限公司&#xff08;簡稱 “飛算科技”&#xff09;便是其中的佼佼者。作為一家國家級高新技術企業&#xff0c;飛算科技以自主創新為核…

電商接口什么意思?

“電商接口”這四個字&#xff0c;在中文互聯網上出現的頻次越來越高&#xff1a;商家后臺、小程序、ERP、數據大屏……幾乎任何與線上零售沾邊的場景都會提到它。然而&#xff0c;對大多數剛進入電商行業的新人&#xff0c;甚至一些已經開了很多年網店的老板來說&#xff0c;這…

前端面試專欄-前沿技術:30.跨端開發技術(React Native、Flutter)

&#x1f525; 歡迎來到前端面試通關指南專欄&#xff01;從js精講到框架到實戰&#xff0c;漸進系統化學習&#xff0c;堅持解鎖新技能&#xff0c;祝你輕松拿下心儀offer。 前端面試通關指南專欄主頁 前端面試專欄規劃詳情 跨端開發技術&#xff08;React Native、Flutter&am…

復盤—MySQL觸發器實現監聽數據表值的變化,對其他數據表做更新

文章目錄 MySQL交換數據庫表中兩列的值(額外的知識) 為防止后面有疑問,提前解釋為什么需要 `$$` ? 第一版需求 第二版需求 第三版需求 注意事項: 存在的嚴重問題 最終版 關鍵修復說明: 完整測試場景: 額外建議(如果需要顯式處理NULL): COALESCE函數 業務中出現的問題…

SpringCloud【Sentinel】

1&#xff0c;工作原理 2&#xff0c;常見規則 流量控制&#xff08;FlowRule&#xff09; 1&#xff0c;閾值類型設置如下 單機均攤&#xff1a;每個機器均攤&#xff0c;比如閾值填5&#xff0c;三個機器&#xff0c;就個機器都可以有5個 總體閾值&#xff1a;所有機器總閾…

解構未來金融:深入剖析DeFi與去中心化交易所(DEX)的技術架構

今天&#xff0c;我們來聊一個顛覆傳統金融界的熱門話題——DeFi&#xff08;去中心化金融&#xff09;。大家可能聽說過它如何承諾將銀行、交易所、保險等金融服務構建在一個開放、無需許可的區塊鏈網絡上。而這一切魔法的核心&#xff0c;正是其獨特的“技術架構”。 在這篇文…

中國西北典型綠洲區土壤水分特征(2018-2019年)

數據集摘要該數據包含張掖綠洲黑河沿岸濕地、過渡帶楊樹林土壤水分、溫度數據。數據采集時間為2018年至2019年&#xff0c;采集地點為張掖綠洲&#xff0c;數據為日數據。該數據集是按照課題制定的試驗方案和中國生態系統研究網絡編著的陸地生態系統水土氣生觀測規范進行數據的…