本地部署DeepSeek方法

本地部署完成后的效果如下圖,整體與chatgpt類似,只是模型在本地推理。

我們在本地部署主要使用兩個工具:

  1. ollama
  2. open-webui

ollama是在本地管理和運行大模型的工具,可以直接在terminal里和大模型對話。open-webui是提供一個類似chatgpt的網頁,相比terminal更加方便和直觀一些。open-webui可自動檢測ollama已經下載的模型,直接選擇使用即可。兩者搭配使用。

使用ollama,我們可以不用配置開發環境,也不需要寫推理代碼,使用起來類似conda或者docker,直接執行指令來運行某個模型就可以。比如想用deepseek模型,就執行ollama run deepseek-r1,想用llama模型,就執行ollama run llama3.3。下面具體介紹一下ollama和安裝方法。

Ollama是一個開源的大型語言模型服務工具,以下是對它的具體介紹:

ollama介紹

特點

  • 本地部署:專注于在本地機器上便捷部署和運行大型語言模型,用戶可在自己設備上運行模型,保護數據隱私,無需擔心數據發送到云端的安全風險。
  • 多系統支持:支持Mac、Linux和Windows等多種操作系統,用戶在不同平臺上都能方便地安裝使用。
  • 多模型支持:支持Deepseek-r1、Llama、Falcon、Qwen2、Phi3、Gemma2等多種流行的LLM模型,用戶可按需選擇,一鍵運行。
  • 易于使用:提供直觀的命令行界面,操作簡單,上手容易,降低了使用門檻。
  • 可擴展性:支持自定義配置,用戶能根據自身硬件環境和模型需求進行優化,還可通過安裝插件增加新功能。
  • 開源:代碼完全開放,用戶可自由查看、修改和分發,活躍的開發者社區也會提供問題解答和持續改進。
  • API支持:提供簡潔的API,方便開發者創建、運行和管理大型語言模型實例,輕松將其集成到各種應用程序中。
  • 預構建模型庫:包含一系列預先訓練好的模型,用戶可直接選用,無需從頭訓練或自行尋找模型源。
  • 模型導入與定制:支持從特定平臺導入已有的大型語言模型,兼容PyTorch或Safetensors深度學習框架,方便用戶集成自有模型。

功能

  • 自動硬件加速:能自動識別并充分利用系統中的最優硬件資源,如NVIDIA GPU、AMD GPU,或利用CPU的AVX、AVX2指令集等,實現針對性優化,確保AI模型高效運行。
  • 無需虛擬化:無需搭建虛擬機或配置復雜軟件環境,可直接開始AI項目開發,簡化流程。
  • 常駐API:在后臺運行,可將強大的AI功能與項目無縫對接,無需額外復雜設置,方便將AI功能整合到應用中。

應用場景

  • 開發和測試:開發人員可以使用Ollama在本地快速搭建語言模型環境,用于開發新的語言相關的應用程序。
  • 個人學習和研究:對于研究自然語言處理的學者或者對語言模型感興趣的個人來說,Ollama提供了一個方便的實驗平臺。
  • 文本生成:可用于生成各種文本內容,如新聞文章、博客文章、詩歌、代碼等。
  • 翻譯:能夠將文本從一種語言翻譯成另一種語言。
  • 問答:可以用于回答用戶提出的各種問題。

下面以macOS為例說明一下安裝過程,windows和linux類似。

ollama安裝

直接訪問其官網ollama,點擊Download下載安裝即可。傻瓜式安裝。

安裝完成后,ollama會在后臺作為服務運行,這時候我們只需要重啟一下terminal,然后運行想要的模型即可。

ollama所有支持的模型都可以從這個網站獲得運行指令和詳細介紹ollama models。

比如我們想用tinyllama模型,就直接執行ollama run tinyllama

類似docker image,經過一個pull的過程后,就可以使用了。

如果想使用deepseek-r1模型,直接運行ollama run deepseek-r1即可。

現在只能在terminal上使用大模型,略顯不方便。如果有個web界面就好了。open-webui就是和ollama深度集成的webui界面,類似chatgpt的。而且不需要額外做什么,安裝ollama后,open-webui會自動檢測已經安裝的模型,選擇對應模型使用即可。

open-webui介紹

Open-WebUI是一個可擴展、功能豐富且用戶友好的自托管AI平臺,
在其官方github的介紹上,就注明了與ollama可以集成。

以下是具體介紹:

特點

  • 部署便捷:可使用Docker或Kubernetes(kubectl、kustomize或helm)進行無縫安裝,支持ollama和cuda tagged鏡像,輕松搭建AI環境。
  • 集成能力強:能與Ollama、OpenAI兼容的API集成,還可自定義OpenAI API的URL,連接到LM Studio、Groq Cloud、Mistral、Open Router等。
  • 安全與權限管理精細:支持基于角色的訪問控制(RBAC),管理員可創建詳細的用戶角色和權限,確保只有授權人員能訪問Ollama及相關敏感信息,且模型創建/拉取權限專屬于管理員。
  • 多端適配好:采用響應式設計,在桌面PC、筆記本電腦和移動設備上都能提供無縫的使用體驗;還提供適用于移動設備的漸進式Web應用程序(PWA),可在localhost上離線訪問,提供類似原生應用的界面。
  • 多語言支持:具備國際化(i18n)支持,用戶可使用自己熟悉的語言操作平臺,且項目方積極尋求貢獻者來擴展支持的語言種類。

功能

  • 文本交互增強:支持完整的Markdown和LaTeX功能,便于用戶進行結構化文檔創建和數學表達式輸入;還支持提示預設,可通過聊天輸入中的命令立即訪問預設提示,也可通過Open WebUI社區集成輕松導入提示。
  • 多媒體交互:支持免提語音/視頻通話,使聊天環境更具動態性和互動性;集成圖像生成功能,可使用AUTOMATIC1111 API(本地)、ComfyUI(本地)和OpenAI的DALL-E(外部)等生成圖像,豐富聊天體驗。
  • 模型管理與操作:可通過Web UI輕松創建Ollama模型,包括創建和添加自定義角色/代理、自定義聊天元素、導入模型等;支持GGUF文件模型創建,能直接從Web UI上傳GGUF文件,也可選擇從計算機上傳或從Hugging Face下載。
  • 代碼與工具集成:提供原生Python函數調用工具,在工具工作區中有內置的代碼編輯器支持,用戶可添加純Python函數,實現與LLMs的無縫集成;支持Pipelines插件框架,可將自定義邏輯和Python庫集成到Open WebUI中。
  • 搜索與瀏覽:集成本地RAG,支持將文檔直接加載到聊天中或添加到文檔庫,通過#命令訪問;支持網頁搜索,可使用SearxNG、Google PSE、Brave Search等多種搜索引擎,并將結果注入聊天;可通過#命令+URL將網站集成到聊天中。

應用場景

  • AI開發與研究:為開發者和研究人員提供了一個便捷的平臺,方便他們快速搭建AI模型的測試和開發環境,進行模型的調試、優化等工作,加速AI項目的研發進程。
  • 智能客服與聊天機器人:可集成各種語言模型,構建智能客服系統或聊天機器人,為用戶提供快速、準確的信息解答和服務支持,提升客戶服務體驗。
  • 內容創作與輔助:幫助內容創作者生成文章、故事、詩歌等各種文本內容,提供創作靈感和思路,提高創作效率和質量。
  • 教育與培訓:在教育領域可用于構建智能輔導系統,根據學生的問題和學習情況提供個性化的解答和指導;也可作為培訓工具,幫助學員更好地理解和掌握知識。

open-webui安裝

在terminal直接執行pip install open-webui即可。安裝完成后,執行open-webui serve

不過經過我測試,在MacBook的safari瀏覽器上,輸入http://0.0.0.0:8080不行,127.0.0.1:8080是可以的

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/67781.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/67781.shtml
英文地址,請注明出處:http://en.pswp.cn/web/67781.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

游戲引擎 Unity - Unity 啟動(下載 Unity Editor、生成 Unity Personal Edition 許可證)

Unity Unity 首次發布于 2005 年,屬于 Unity Technologies Unity 使用的開發技術有:C# Unity 的適用平臺:PC、主機、移動設備、VR / AR、Web 等 Unity 的適用領域:開發中等畫質中小型項目 Unity 適合初學者或需要快速上手的開…

【開源免費】基于Vue和SpringBoot的公寓報修管理系統(附論文)

本文項目編號 T 186 ,文末自助獲取源碼 \color{red}{T186,文末自助獲取源碼} T186,文末自助獲取源碼 目錄 一、系統介紹二、數據庫設計三、配套教程3.1 啟動教程3.2 講解視頻3.3 二次開發教程 四、功能截圖五、文案資料5.1 選題背景5.2 國內…

Haskell語言的多線程編程

Haskell語言的多線程編程 Haskell是一種基于函數式編程范式的編程語言,以其強大的類型系統和懶惰求值著稱。近年來,隨著多核處理器的發展,多線程編程變得日益重要。雖然Haskell最初并不是為了多線程而設計,但它的設計理念和工具集…

《蒼穹外賣》項目學習記錄-Day11訂單統計

根據起始時間和結束時間,先把begin放入集合中用while循環當begin不等于end的時候,讓begin加一天,這樣就把這個區間內的時間放到List集合。 查詢每天的訂單總數也就是查詢的時間段是大于當天的開始時間(0點0分0秒)小于…

【python】python油田數據分析與可視化(源碼+數據集)【獨一無二】

👉博__主👈:米碼收割機 👉技__能👈:C/Python語言 👉專__注👈:專注主流機器人、人工智能等相關領域的開發、測試技術。 【python】python油田數據分析與可視化&#xff08…

FBX SDK的使用:基礎知識

Windows環境配置 FBX SDK安裝后,目錄下有三個文件夾: include 頭文件lib 編譯的二進制庫,根據你項目的配置去包含相應的庫samples 官方使用案列 動態鏈接 libfbxsdk.dll, libfbxsdk.lib是動態庫,需要在配置屬性->C/C->預…

【單層神經網絡】基于MXNet庫簡化實現線性回歸

寫在前面 同最開始的兩篇文章 完整程序及注釋 導入使用的庫# 基本 from mxnet import autograd, nd, gluon # 模型、網絡 from mxnet.gluon import nn from mxnet import init # 學習 from mxnet.gluon import loss as gloss # 數據集 from mxnet.gluon…

【爬蟲】JS逆向解決某藥的商品價格加密

??????????歡迎來到我的博客?????????? ??作者:秋無之地 ??簡介:CSDN爬蟲、后端、大數據領域創作者。目前從事python爬蟲、后端和大數據等相關工作,主要擅長領域有:爬蟲、后端、大數據開發、數據分析等。 ??歡迎小伙伴們點贊????、收藏??、…

OpenAI開源戰略反思:中國力量推動AI產業變革

在周五的Reddit問答會上,OpenAI首席執行官Sam Altman罕見承認公司正面臨來自中國科技企業的強勁挑戰。這位向來強硬的硅谷領軍者坦言,以深度求索(DeepSeek)為代表的中國AI公司正在改寫行業游戲規則。 這場歷時三小時的對話揭示了…

一文講解HashMap線程安全相關問題(上)

HashMap不是線程安全的,主要有以下幾個問題: ①、多線程下擴容會死循環。JDK1.7 中的 HashMap 使用的是頭插法插入元素,在多線程的環境下,擴容的時候就有可能導致出現環形鏈表,造成死循環。 JDK 8 時已經修復了這個問…

android java系統彈窗的基礎模板

1、資源文件 app\src\main\res\layout下增加custom_pop_layout.xml 定義彈窗的控件資源。 <?xml version"1.0" encoding"utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xmlns:android"http://schemas.android.com/apk/…

python學習——常用的內置函數匯總

文章目錄 類型轉換函數數學函數常用的迭代器操作函數常用的其他內置函數 類型轉換函數 數學函數 常用的迭代器操作函數 實操&#xff1a; from cv2.gapi import descr_oflst [55, 42, 37, 2, 66, 23, 18, 99]# (1) 排序操作 asc_lst sorted(lst) # 升序 desc_lst sorted(l…

《解鎖AI黑科技:數據分類聚類與可視化》

在當今數字化時代&#xff0c;數據如潮水般涌來&#xff0c;如何從海量數據中提取有價值的信息&#xff0c;成為了眾多領域面臨的關鍵挑戰。人工智能&#xff08;AI&#xff09;技術的崛起&#xff0c;為解決這一難題提供了強大的工具。其中&#xff0c;能夠實現數據分類與聚類…

MySQL數據庫環境搭建

下載MySQL 官網&#xff1a;https://downloads.mysql.com/archives/installer/ 下載社區版就行了。 安裝流程 看b站大佬的視頻吧&#xff1a;https://www.bilibili.com/video/BV12q4y1477i/?spm_id_from333.337.search-card.all.click&vd_source37dfd298d2133f3e1f3e3c…

AI學習指南HuggingFace篇-Tokenizers 與文本處理

一、引言 在自然語言處理(NLP)中,文本數據的預處理是至關重要的一步。分詞器(Tokenizers)是將文本分割成單詞、短語或其他單元的工具,是文本處理的基礎。Hugging Face的Tokenizers庫提供了高效且靈活的分詞工具,支持多種預訓練模型的分詞需求。本文將深入講解Tokenizer…

如何用微信小程序寫春聯

? 生活沒有模板,只需心燈一盞。 如果笑能讓你釋然,那就開懷一笑;如果哭能讓你減壓,那就讓淚水流下來。如果沉默是金,那就不用解釋;如果放下能更好地前行,就別再扛著。 一、引入 Vant UI 1、通過 npm 安裝 npm i @vant/weapp -S --production?? 2、修改 app.json …

[SAP ABAP] 靜態斷點的使用

在 ABAP 編程環境中&#xff0c;靜態斷點通過關鍵字BREAK-POINT實現&#xff0c;當程序執行到這一語句時&#xff0c;會觸發調試器中斷程序的運行&#xff0c;允許開發人員檢查當前狀態并逐步跟蹤后續代碼邏輯 通常情況下&#xff0c;在代碼的關鍵位置插入靜態斷點可以幫助開發…

96,【4】 buuctf web [BJDCTF2020]EzPHP

進入靶場 查看源代碼 GFXEIM3YFZYGQ4A 一看就是編碼后的 1nD3x.php 訪問 得到源代碼 <?php // 高亮顯示當前 PHP 文件的源代碼&#xff0c;用于調試或展示代碼結構 highlight_file(__FILE__); // 關閉所有 PHP 錯誤報告&#xff0c;防止錯誤信息泄露可能的安全漏洞 erro…

基于深度學習的輸電線路缺陷檢測算法研究(論文+源碼)

輸電線路關鍵部件的缺陷檢測對于電網安全運行至關重要&#xff0c;傳統方法存在效率低、準確性不高等問題。本研究探討了利用深度學習技術進行輸電線路關鍵組件的缺陷檢測&#xff0c;目的是提升檢測的效率與準確度。選用了YOLOv8模型作為基礎&#xff0c;并通過加入CA注意力機…

3、從langchain到rag

文章目錄 本文介紹向量和向量數據庫向量向量數據庫 索引開始動手實現rag加載文檔數據并建立索引將向量存放到向量數據庫中檢索生成構成一條鏈 本文介紹 從本節開始&#xff0c;有了上一節的langchain基礎學習&#xff0c;接下來使用langchain實現一個rag應用&#xff0c;并稍微…