【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow構建私有知識庫

文章目錄

  • DeepSeek介紹
    • 公司背景
    • 核心技術
    • 產品與服務
    • 應用場景
    • 優勢與特點
    • 訪問與體驗
    • 各個DeepSeek-R系列模型的硬件需求和適用場景
  • Ollama
    • 主要特點
    • 優勢
    • 應用場景
    • 安裝和使用
    • 配置環境變量
    • 總結
  • 安裝open-webui
    • 下載和安裝docker desktop
    • 配置鏡像源
    • 安裝open-webui
    • 運行和使用
  • RagFlow介紹
    • 主要功能
    • 適用場景
    • 優勢
    • 下載及安裝
    • 私有知識庫
      • 1. 模型供應商配置
      • 2. 創建知識庫
      • 3. 創建數據集
      • 4. 創建助理和對話

在這里插入圖片描述

個人主頁:道友老李
歡迎加入社區:道友老李的學習社區

DeepSeek介紹

DeepSeek官網

DeepSeek(深度求索)是一家專注于實現通用人工智能(AGI)的中國科技公司,致力于通過技術探索與創新,推動智能技術的廣泛應用。以下是其核心信息的概述:


公司背景

  • 成立時間:2023年(具體時間未公開披露)
  • 總部:中國杭州
  • 使命:通過AGI技術提升人類生產力,推動社會進步。
  • 愿景:成為全球AGI領域的領導者。

核心技術

  1. 大語言模型(LLM)

    • 自主研發高性能基座模型(如DeepSeek-R1、DeepSeek-R2),支持長文本理解、復雜推理和多語言處理。
    • 模型參數量覆蓋數十億至千億級,平衡性能與計算效率。
  2. 多模態AI

    • 整合文本、圖像、語音等多模態數據,開發跨模態理解與生成能力。
  3. 搜索增強技術

    • 結合搜索引擎實時數據,提升模型在知識更新與事實準確性上的表現。

產品與服務

  • 通用大模型:面向開發者的開放API(如DeepSeek API),支持文本生成、代碼編寫等任務。
  • 行業定制模型:針對金融、醫療、教育等領域提供垂直場景優化方案。
  • 企業級平臺:提供模型訓練、部署及管理的全流程工具鏈(如Fine-tuning平臺)。
  • 開源社區:部分模型和技術開源,促進開發者協作(如發布輕量版模型)。

應用場景

  • 智能客服:自動化應答與客戶意圖分析。
  • 內容生成:營銷文案、代碼、報告等自動化創作。
  • 數據分析:從非結構化數據中提取洞察,輔助決策。
  • 教育:個性化學習助手與智能題庫生成。

優勢與特點

  • 技術領先:模型性能在多項基準測試(如MMLU、HumanEval)中位居前列。
  • 場景深耕:聚焦企業級需求,提供高可用的行業解決方案。
  • 生態合作:與云計算廠商、硬件供應商及高校建立聯合實驗室。

訪問與體驗

  • 官網提供在線體驗入口(如Chat界面)和開發者文檔。
  • 部分模型可通過Hugging Face、GitHub等平臺獲取。

如需更詳細的技術參數、商業合作或最新動態,建議訪問其官方網站或查閱官方發布的白皮書。

各個DeepSeek-R系列模型的硬件需求和適用場景

在這里插入圖片描述
我的電腦配置:
在這里插入圖片描述
可以跑7b和14b

Ollama

ollama search

Ollama 是一個開源的 AI 推理框架,專注于模型壓縮和部署。它的目標是幫助用戶在本地或邊緣設備上高效運行大型語言模型(LLM),通過量化和其他技術顯著減少模型大小,同時保持高性能。

主要特點

  1. 模型壓縮與優化

    • Ollama 提供了多種模型壓縮技術,如 4-bit 和 8-bit 量化,使大模型能夠在低資源環境下運行。
    • 支持主流語言模型(如 LLaMA、Vicuna 等)的適配和部署。
  2. 高性能推理

    • Ollama 能夠在本地設備上實現低延遲、高吞吐量的推理,適合實時應用。
  3. 易于部署

    • 提供簡潔的命令行界面(CLI),用戶可以輕松下載模型、調整參數并運行推理服務。
    • 支持 Docker 部署,便于在云服務器或邊緣設備上快速搭建。
  4. 社區驅動

    • Ollama 是一個開源項目,依賴于活躍的社區支持,用戶可以根據需求貢獻和改進功能。

優勢

  • 輕量化:通過量化技術顯著降低模型大小,適合資源受限的環境。
  • 高性能:優化了推理速度,能夠在本地快速響應。
  • 靈活性:支持多種模型格式和后端(如 GGML、TensorRT 等)。
  • 易于上手:用戶無需復雜的配置即可開始使用。

應用場景

  1. 本地開發與實驗

    • 開發者可以輕松在本地運行 LLM,用于快速測試和原型設計。
  2. 邊緣計算

    • 在邊緣設備(如 Raspberry Pi)上部署輕量級 AI 服務。
  3. 實時推理服務

    • 快速搭建支持多語言模型的推理服務器,滿足企業或個人需求。
  4. 教育與研究

    • 提供了一個易于使用的工具,適合教學和研究場景。

安裝和使用

國內下載:Ollama下載

  1. 打開cmd控制臺,輸入:

    ollama
    

    可以看到幫助命令
    在這里插入圖片描述

  2. 下載模型(以 DeepSeek-R系列為例):

    ollama pull deepseek-r1:1.5b
    
  3. 啟動推理服務:

    ollama serve --port 11434
    
  4. 運行模型:

     ollama run deepseek-r1:1.5b
    

可以開始對話了。

配置環境變量

在這里插入圖片描述
OLLAMA_MODELS 是修改OLLAMA下載的模型存儲位置,默認是在C盤

總結

Ollama 是一個強大的工具,旨在簡化大型語言模型的部署和推理過程。它通過模型壓縮和優化技術,使得在本地或邊緣設備上運行 AI 模型變得高效且易于管理。無論是開發者、研究人員還是企業用戶,Ollama 都能提供靈活和支持,滿足多種應用場景的需求。

安裝open-webui

下載和安裝docker desktop

官網地址:Docker Desktop
在這里插入圖片描述

GitHub地址:Docker Desktop

在這里插入圖片描述

配置鏡像源

在這里插入圖片描述
第一個是阿里云的鏡像源,可登錄阿里云平臺查看

"registry-mirrors": ["https://${阿里云的}.mirror.aliyuncs.com","https://docker.m.daocloud.io","https://mirror.baidubce.com","https://docker.nju.edu.cn","https://mirror.iscas.ac.cn"]

安裝open-webui

搜索open-webui
在這里插入圖片描述
在這里插入圖片描述
我這里已經安裝過了。

運行和使用

在容器中運行open-webui,然后瀏覽器輸入http://localhost:3000
在這里插入圖片描述
進入設置
在這里插入圖片描述
配置Ollama地址
在這里插入圖片描述
配置好后,保存,正常的情況下,界面就會顯示Ollama中已下載好的模型了
在這里插入圖片描述
完成!可以開始對話了!

RagFlow介紹

RagFlow 是一個基于大語言模型的流程自動化工具,旨在幫助用戶通過自然語言處理(NLP)技術來自動化和優化工作流程。它結合了先進的AI技術和直觀的用戶界面,使得非技術人員也能輕松實現流程自動化。

主要功能

  1. 智能對話交互:用戶可以通過與RagFlow進行自然語言對話,定義、管理和優化各種工作流程。
  2. 任務自動化:支持多種任務類型,如數據處理、信息提取、報告生成等,幫助用戶自動完成重復性工作。
  3. 跨系統集成:能夠與主流的第三方服務(如Slack、Jira、Google Drive等)無縫集成,實現不同系統的數據流動和協同工作。
  4. 動態流程調整:根據實時數據和上下文環境,智能調整工作流程,確保流程始終高效運行。
  5. 可擴展性:支持大規模業務需求,適用于從個人到企業的各種場景。

適用場景

  • 企業流程優化:幫助企業在銷售、 marketing、客服等環節實現自動化,提升效率。
  • 個人任務管理:用戶可以通過RagFlow自動化個人日常任務,如行程安排、郵件處理等。
  • 數據整合與分析:通過自動化數據收集和處理,支持更高效的決策制定。

優勢

  • 易用性:無需編程知識,用戶即可快速上手。
  • 靈活性:支持定制化需求,滿足不同用戶的個性化要求。
  • 高效性:利用AI技術提升流程執行效率,減少人工干預。

RagFlow 通過將復雜的流程自動化轉化為簡單的對話交互,極大地提升了工作效率和用戶體驗。如果你有具體的使用場景或問題,可以進一步探討如何利用RagFlow來優化你的工作流程!

下載及安裝

  1. 從github上下載 ragflow或直接:
git clone https://github.com/infiniflow/ragflow.git
  1. 運行腳本:進入docker 文件夾,利用提前編譯好的 Docker 鏡像啟動服務器
docker compose -f docker-compose-CN.yml up -d

這個過程會很慢,成功后,會自動運行容器中的服務:
在這里插入圖片描述
瀏覽器上輸入:http://localhost
在這里插入圖片描述
第一個注冊的賬號就是管理員,登錄成功
在這里插入圖片描述

私有知識庫

1. 模型供應商配置

點擊頭像,進入模型供應商配置
在這里插入圖片描述
選擇下面列表中的Ollama,然后進行模型配置
在這里插入圖片描述
模型名稱就是Ollama中下載的模型名稱

2. 創建知識庫

在這里插入圖片描述
解析方法改成General,其他默認即可
在這里插入圖片描述

3. 創建數據集

在這里插入圖片描述
新增本地文件
在這里插入圖片描述
執行解析,等待解析完成
在這里插入圖片描述
在這里插入圖片描述

4. 創建助理和對話

切換到聊天頁,新建助理,選擇知識庫
在這里插入圖片描述

切換到模型設置,調整一下最大token數
在這里插入圖片描述
新建聊天,開始對話
在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/895408.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/895408.shtml
英文地址,請注明出處:http://en.pswp.cn/news/895408.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

更加通用的Hexo多端部署原理及實現,適用于各種系統之間

本文推薦在作者的個人博客網站閱讀:shenying.online 一、故事背景 故事發生在大學上學期間(而不是寒假)。上學期間,宿舍條件極其惡劣,半夜斷電、空間狹小。我們大學垃圾條件使用游戲本的種種弊端被無限放大&#xff1…

開源、免費項目管理工具比較:2025最新整理30款

好用的開源、免費版項目管理系統有:1.Redmine;2. Taiga;3. OpenProject; 4.ProjectLibre; 5.GanttProject; 6.Tuleap; 7.Trac;8. Phabricator; 9.Notion; 10.…

組織結構改革:激活企業活力的 “源頭活水”

難以適應市場變化、內部溝通與協作不暢、決策效率低下、運營成本增加、人才流失嚴重、員工士氣下降、戰略目標難以實現……企業如何根據市場環境變化和自身發展需求,靈活調整組織框架,賦能企業的持續健康發展? 某國有投資建設集團旗下的二級…

oracle中decode怎么轉換成pg

對于 PostgreSQL 中的 Oracle DECODE 函數,可以使用 CASE 表達式或聯合。CASE 表達式根據條件返回第一個匹配的結果,語法為:CASE WHEN 條件 THEN 結果 ELSE 結果 END。聯合通過 UNION ALL 操作符組合多個 SELECT 語句,返回一個包含…

Mac之JDK安裝

Mac之JDK安裝 一.安裝 jdk 打開終端輸入命令:java -version 查看是否已安裝 JDK Oracle 官方下載地址 根據自己Mac 系統安裝 查看 Mac 系統,打開中斷命令,輸入: uname -a Compressed Archive 是壓縮文檔,下載的是一個 .tar.gz 壓縮包 D…

【含文檔+PPT+源碼】基于Python的全國景區數據分析以及可視化實現

項目介紹 本課程演示的是一款基于Python的全國景區數據分析以及可視化實現,主要針對計算機相關專業的正在做畢設的學生與需要項目實戰練習的 Java 學習者。 包含:項目源碼、項目文檔、數據庫腳本、軟件工具等所有資料 帶你從零開始部署運行本套系統 該…

Unity中快速制作2D沙雕動畫:流程編

Unity中快速制作2D沙雕動畫(搞笑/無厘頭風格),通過以下方案實現低成本、高成效的開發流程,結合夸張的動作、滑稽的物理效果和魔性音效: 1. 角色與素材設計 核心原則:丑萌即正義,越怪越好&#…

保存字典類型的文件用什么格式比較好

保存 Python 字典類型的數據時,有幾個常見的格式可以選擇,這些格式都具有良好的可讀性和提取內容的便利性。以下是幾種推薦的格式: JSON 格式: 優點:JSON 格式非常適合存儲和傳輸結構化數據,具有良好的跨平…

SQL注入之布爾和時間盲注,sqli-labs

實驗環境: sqli-labs,小皮面板搭建,edge瀏覽器 apache:2.4.39,MySQL:5.7 PHP:5.39 Python(pycharm2023):3 less-8 布爾盲注: 1.我這里是采用最簡單的直接采…

基于SSM的農產品供銷小程序+LW示例參考

1.項目介紹 系統角色:管理員、農戶功能模塊:用戶管理、農戶管理、產品分類管理、農產品管理、咨詢管理、訂單管理、收藏管理、購物車、充值、下單等技術選型:SSM,Vue(后端管理web),uniapp等測試…

移植BOA服務器到GEC2440開發板

所需軟件:boa-0.94.13.tar.tar(下載:http://www.boa.org/boa-0.94.13.tar.gz) 步驟: 設置好交叉編譯工具鏈。 1、解壓下載好的壓縮包(tar xzvf boa-0.94.13.tar.tar),并進入解壓后的目錄(cd boa-0.94.13),再進行如下操作: 先進入到src目錄(下面操作都是在該目錄下進行…

Go 語言里中的堆與棧

在 Go 語言里,堆和棧是內存管理的兩個重要概念,它們在多個方面存在明顯差異: 1. 內存分配與回收方式 棧 分配:Go 語言中,棧內存主要用于存儲函數的局部變量和調用信息。當一個函數被調用時,Go 會自動為其…

從360度全景照片到高質量3D場景:介紹SC-Omnigs 3D重建系統

在當今的數字化時代,3D重建技術正在迅速發展,并廣泛應用于文旅、空間智能和3D重建等領域。為了簡化360度全景相機拍攝數據的處理流程,提高3D場景重建的質量和效率,我們開發了一款專門處理360度全景相機數據的3D重建系統——SC-Omnigs。本文將詳細介紹這一系統的功能、特點及…

LayUi table 列寬 th和td不同步變化

原因 在td所在的table中,當table寬度小于頁面寬度,滾動條會消失,進而table會被加以下樣式 style"width: auto"解決 在layui.js中將以下語句 !p&&h?y.width(o.getContentWidth(l)):y.width("auto")替換成 !…

HARCT 2025 分論壇10:Intelligent Medical Robotics智能醫療機器人

會議名稱:機電液一體化與先進機器人控制技術國際會議 會議簡稱:HARCT 2025 大會時間:2025年3月28日-30日 大會地點:中國桂林 主辦單位:桂林航天工業學院、廣西大學、桂林電子科技大學、桂林理工大學 協辦單位&…

前端可以不用依賴后端實現導出大數據了

theme: channing-cyan hightlight: channing-cyan 前言 在我們公司表格數據導出都是前端去處理。一開始數據量不大,倒沒什么問題。但隨著數據量的加大,問題也逐漸暴露出來。 一天的數據量有一來萬條,導出一定時間范圍的數據,30…

Java 后端開發:如何提取請求頭中的 Cookie 和身份驗證 Token

在 Java 后端開發中,處理 HTTP 請求時,經常需要從請求頭中提取特定的信息,如 Cookie 和身份驗證 Token。這些信息對于實現用戶會話管理、身份驗證和授權等功能至關重要。本文將詳細介紹如何在 Java 后端接口中提取請求頭中的 Cookie 和 Token…

游戲引擎學習第99天

倉庫:https://gitee.com/mrxiao_com/2d_game_2 黑板:制作一些光場(Light Field) 當前的目標是為游戲添加光照系統,并已完成了法線映射(normal maps)的管道,但還沒有創建可以供這些正常映射采樣的光場。為了繼續推進&…

通過 Docker 安裝和部署 KeyDB v6.3.4 的詳細步驟

KeyDB 是一種高性能的開源內存數據庫,最初是基于 Redis 項目開發的,但在性能、特性和功能上進行了許多增強和改進。它兼容 Redis 的大部分命令和數據結構,因此可以作為 Redis 的替代品使用,尤其是在需要更高性能和多線程支持的場景…

Android Studio 打包App問題

一、場景 windows 電腦C 盤空間越來越少,所有軟件默認位置都往C盤用戶目錄寫入數據,于是開始準備整理,Android Studio 相關的 .android 和 .gradle 目錄成為了目標。 二、問題出現 1、將C盤的.gradle 目錄拷貝到D盤,文件比較大&a…