ragflow本地部署教程linux Ubuntu系統

以下是一份在 Ubuntu 系統上本地部署 RAGFlow 的詳細教程。
一、基礎環境準備
1.硬件要求
–CPU ≥ 4核
–RAM ≥ 16 GB
–磁盤空間 ≥ 50 GB(建議 SSD)

2.系統配置

更新系統

sudo apt update && sudo apt upgrade -y

設置內核參數(Elasticsearch 必需)

sudo sysctl -w vm.max_map_count=262144
echo “vm.max_map_count=262144” | sudo tee -a /etc/sysctl.conf # 永久生效

二、安裝 Docker 與 Docker Compose
1.卸載舊版本(如有)

sudo apt remove docker docker-engine docker.io containerd runc
2.安裝依賴與 Docker

sudo apt install apt-transport-https ca-certificates curl gnupg-agent software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable”
sudo apt update
sudo apt install docker-ce docker-ce-cli containerd.io
3.安裝 Docker Compose v2.26.1+

sudo curl -L “https://github.com/docker/compose/releases/download/v2.26.1/docker-compose- ( u n a m e ? s ) ? (uname -s)- (uname?s)?(uname -m)” -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
4.配置國內鏡像加速
創建 /etc/docker/daemon.json:

Json {
“registry-mirrors”: [“https://docker.1panel.live”, “https://dockerproxy.cn”]
}
重啟服務:
sudo systemctl daemon-reload
sudo systemctl restart docker

三、部署 RAGFlow
1.克隆倉庫

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
chmod +x ./entrypoint.sh # 授予執行權限
2.啟動服務(默認使用 CPU 版本)

docker compose -f docker-compose.yml up -d
注:GPU 加速需使用 docker-compose-gpu.yml(需已安裝 NVIDIA 驅動) 。
3.驗證服務狀態

docker logs -f ragflow-server # 出現 “RAGFlow is running!” 即成功
4.訪問 Web UI
瀏覽器打開:http://<服務器IP>:8080(默認端口 8080,可在 .env 中修改 SVR_HTTP_PORT) 。

四、配置 Ollama 本地模型
1.安裝 Ollama

curl -fsSL https://ollama.com/install.sh | sh
2.修改配置文件(監聽所有 IP)

sudo vim /etc/systemd/system/ollama.service
添加兩行:
Ini [Service]
Environment=“OLLAMA_HOST=0.0.0.0:11434”
Environment=“OLLAMA_MODELS=/path/to/ollama_cache” # 自定義模型存儲路徑
重啟服務:
sudo systemctl daemon-reload
sudo systemctl restart ollama
3.下載模型(如 DeepSeek-R1)

ollama run deepseek-ai/deepseek-r1:latest

?? 五、RAGFlow 模型與知識庫配置
1.Web UI 中添加 Ollama 模型
–登錄 RAGFlow → 右上角頭像 → 模型供應商 → 選擇 Ollama
–填寫信息:
?模型名稱:deepseek-r1(與 ollama list 名稱一致)
?基礎 URL:http://<服務器IP>:11434
?最大 Token:4096

2.設置系統模型
–聊天模型:選擇剛添加的 deepseek-r1
–嵌入模型:推薦 shaw/dmeta-embedding-zh:latest(需先通過 Ollama 下載)

3.創建知識庫
–知識庫 → 新建知識庫 → 上傳文檔(支持 Word/PDF/Excel 等)
–配置解析方法(按文檔類型選擇模板)

4.新建助理并測試
–聊天 → 新建助理 → 綁定知識庫 → 開始問答測試

?? 六、常見問題解決
?端口沖突:修改 ragflow/docker/.env 中的 SVR_HTTP_PORT,重啟服務。
?鏡像拉取慢:確保 Docker 鏡像加速配置生效(見第二.4步)。
?Ollama 連接失敗:檢查防火墻是否放行 11434 端口,確認 OLLAMA_HOST 配置正確。
?模型加載錯誤:確認 Ollama 模型名稱與 RAGFlow 中填寫一致,且已下載完成。

💎 總結
本教程覆蓋了從系統配置到模型集成的全流程,關鍵點包括:
1.內核參數 vm.max_map_count 對 Elasticsearch 至關重要;
2.Docker 鏡像加速可大幅提升部署效率;
3.Ollama 需配置為 0.0.0.0 監聽以實現跨容器通信;
4.知識庫支持的文檔類型豐富,解析方法需匹配文件格式。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/87871.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/87871.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/87871.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

[netty5: WebSocketClientHandshaker WebSocketClientHandshakerFactory]-源碼分析

在閱讀這篇文章前&#xff0c;推薦先閱讀以下內容&#xff1a; [netty5: WebSocketFrame]-源碼分析[netty5: WebSocketFrameEncoder & WebSocketFrameDecoder]-源碼解析 WebSocketClientHandshakerFactory WebSocketClientHandshakerFactory 是用于根據 URI 和協議版本創…

4.2 如何訓練?個 LLM

?般??&#xff0c;訓練?個完整的 LLM 需要經過圖1中的三個階段——Pretrain、SFT 和 RLHF。 4.2.1 Pretrain 預訓練任務與架構 任務類型&#xff1a;采用因果語言模型&#xff08;CLM&#xff09;&#xff0c;通過預測下一個 token 進行訓練&#xff0c;與傳統預訓練模型…

Qt中的QObject::moveToThread方法詳解

一、QObject::moveToThread方法QObject::moveToThread()是Qt框架中一個非常重要的功能&#xff0c;它允許改變QObject及其子對象的線程關聯性。這個功能在多線程編程中特別有用&#xff0c;可以將耗時操作移到工作線程執行&#xff0c;避免阻塞主線程/GUI線程。基本用法void QO…

【9】用戶接入與認證配置

本文旨在幫助網絡管理員在 SD-WAN 環境中實現安全、穩定的用戶接入與認證策略,涵蓋本地/遠程認證、權限管理、密碼策略、SSH、會話控制等關鍵配置要素。 1.密碼策略與賬戶安全 從 IOS XE SD-WAN 17.3.1 起,Cisco 引入密碼強化功能,用于統一用戶密碼的復雜度與有效性要求。密…

第十六節:第三部分:多線程:線程安全問題、取錢問題的模擬

線程安全問題介紹&#xff1a;取錢的線程安全問題 取錢的線程安全問題 取錢案例需求分析 線程安全問題出現的原因 代碼&#xff1a;模擬線程安全問題&#xff08;上述取錢案例&#xff09; Account類&#xff08;賬戶類&#xff09; package com.itheima.day3_thread_safe;pu…

APE:大語言模型具有人類水平的提示工程能力

摘要 通過以自然語言指令作為條件輸入&#xff0c;大型語言模型&#xff08;LLMs&#xff09;展現出令人印象深刻的通用計算能力。然而&#xff0c;任務表現嚴重依賴于用于引導模型的提示&#xff08;prompt&#xff09;質量&#xff0c;而最有效的提示通常是由人類手工設計的…

X86 CPU 工作模式

1.概述 1.實模式 實模式又稱實地址模式&#xff0c;實&#xff0c;即真實&#xff0c;這個真實分為兩個方面&#xff0c;一個方面是運行真實的指令&#xff0c;對指令的動作不作區分&#xff0c;直接執行指令的真實功能&#xff0c;另一方面是發往內存的地址是真實的&#xff…

Java設計模式之行為型模式(策略模式)介紹與說明

一、策略模式簡介 策略模式&#xff08;Strategy Pattern&#xff09;是一種行為型設計模式&#xff0c;它定義了一系列算法&#xff0c;并將每個算法封裝起來&#xff0c;使它們可以相互替換&#xff0c;且算法的變化不會影響使用算法的客戶。策略模式讓算法獨立于使用它的客…

【BIOS+MBR 微內核手寫實現】

本文基于BIOS+MBR的架構,從四部分講解微內核是如何實現的: 1)搭建微內核編譯調試環境 2)梳理微內核的代碼結構:偽指令講解 3)手寫實現微內核框架,輸出簡單的字符串 4)講解微內核啟動階段的具體運行過程 先完成內核工程創建,如下圖 我們這里使用nasm風格的匯編編寫,…

從C/C++遷移到Go:內存管理思維轉變

一、引言 在當今高速發展的軟件開發世界中&#xff0c;語言遷移已成為技術進化的常態。作為一名曾經的C/C開發者&#xff0c;我經歷了向Go語言轉變的全過程&#xff0c;其中最大的認知挑戰來自內存管理模式的根本性差異。 我記得第一次接觸Go項目時的困惑&#xff1a;沒有析構函…

正確設置 FreeRTOS 與 STM32 的中斷優先級

在裸機開發&#xff08;非 RTOS&#xff09;時&#xff0c;大多數 STM32 外設的中斷優先級通常不需要手動配置&#xff0c;原因如下&#xff1a; ? 裸機開發中默認中斷優先級行為 特點說明默認中斷優先級為 0如果你不設置&#xff0c;STM32 HAL 默認設置所有外設中斷為 0&…

EasyExcel之SheetWriteHandler:解鎖Excel寫入的高階玩法

引言在 EasyExcel 強大的功能體系中&#xff0c;SheetWriteHandler 接口是一個關鍵的組成部分。它允許開發者在寫入 Excel 的 Sheet 時進行自定義處理&#xff0c;為實現各種復雜的業務需求提供了強大的支持。通過深入了解和運用 SheetWriteHandler 接口&#xff0c;我們能夠更…

Python單例模式魔法方法or屬性

1.單例模式概念定義:單例模式(Singleton Pattern)是一種創建型設計模式&#xff0c;它確保一個類只能有一個實例&#xff0c;并提供一個全局訪問點來獲取該實例。這種模式在需要控制資源訪問、配置管理或協調系統操作時特別有用。核心特點:私有構造函數&#xff1a;防止外部通過…

【Kubernetes系列】Kubernetes 資源請求(Requests)

博客目錄 引言一、資源請求的基本概念1.1 什么是資源請求1.2 請求與限制的區別 二、CPU 請求的深入解析2.1 CPU 請求的單位與含義2.2 CPU 請求的調度影響2.3 CPU 請求與限制的關系 三、內存請求的深入解析3.1 內存請求的單位與含義3.2 內存請求的調度影響3.3 內存請求的特殊性 …

大型語言模型中的自動化思維鏈提示

摘要 大型語言模型&#xff08;LLMs&#xff09;能夠通過生成中間推理步驟來執行復雜的推理任務。為提示演示提供這些步驟的過程被稱為思維鏈&#xff08;CoT&#xff09;提示。CoT提示有兩種主要范式。一種使用簡單的提示語&#xff0c;如“讓我們一步一步思考”&#xff0c;…

Private Set Generation with Discriminative Information(2211.04446v1)

1. 遇到什么問題&#xff0c;解決了什么遇到的問題現有差分隱私生成模型受限于高維數據分布建模的復雜性&#xff0c;合成樣本實用性不足。深度生成模型訓練依賴大量數據&#xff0c;加入隱私約束后更難優化&#xff0c;且不保證下游任務&#xff08;如分類&#xff09;的最優解…

C++編程語言入門指南

一、C語言概述 C是由丹麥計算機科學家Bjarne Stroustrup于1979年在貝爾實驗室開發的一種靜態類型、編譯式、通用型編程語言。最初被稱為"C with Classes"(帶類的C)&#xff0c;1983年更名為C。它既具有高級語言的抽象特性&#xff0c;又保留了底層硬件操作能力&…

ZED相機與Foxglove集成:加速機器人視覺調試效率的實用方案

隨著機器人技術的發展&#xff0c;實時視覺數據流的高效傳輸和可視化成為提升系統性能的重要因素。通過ZED相機&#xff08;包括ZED 2i和ZED X&#xff09;與Foxglove Studio平臺的結合&#xff0c;開發者能夠輕松訪問高質量的2D圖像、深度圖和點云數據&#xff0c;從而顯著提高…

目標檢測新紀元:DETR到Mamba實戰解析

&#x1f680;【實戰分享】目標檢測的“后 DE?”時代&#xff1a;DETR/DINO/RT-DETR及新型骨干網絡探索&#xff08;含示例代碼&#xff09; 目標檢測從 YOLO、Faster R-CNN 到 Transformer 結構的 DETR&#xff0c;再到 DINO、RT-DETR&#xff0c;近兩年出現了許多新趨勢&am…

【IOS】XCode創建firstapp并運行(成為IOS開發者)

&#x1f60f;★,:.☆(&#xffe3;▽&#xffe3;)/$:.★ &#x1f60f; 這篇文章主要介紹XCode創建firstapp并運行 學其所用&#xff0c;用其所學。——梁啟超 歡迎來到我的博客&#xff0c;一起學習&#xff0c;共同進步。 喜歡的朋友可以關注一下&#xff0c;下次更新不迷路…