RagFlow 源碼部署啟動指南

一、環境準備

1. 安裝 uvpre-commit

如果已安裝,可跳過。推薦使用官方方式安裝,避免報錯:

pipx install uv pre-commit
export UV_INDEX=https://mirrors.aliyun.com/pypi/simple

安裝報錯

使用清華源安裝:

pipx install uv --pip-args="--index-url https://pypi.tuna.tsinghua.edu.cn/simple"
pipx install pre-commit --pip-args="--index-url https://pypi.tuna.tsinghua.edu.cn/simple"

設置環境變量:

pipx ensurepath

執行后請開啟新終端


二、下載項目源碼并安裝依賴

2. 下載代碼并同步依賴

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
uv sync --python 3.10 --all-extras  # 安裝依賴模塊

設置 HuggingFace 鏡像地址:

export HF_ENDPOINT=https://hf-mirror.com
uv run download_deps.py
# 如果要使用鏡像請執行:uv run download_deps.py --china-mirrors
pre-commit install

?? 注意事項:

  • download_deps文件中只有部分下載可以有鏡像源,nltk部分的鏡像源是沒有的
  • 安裝中可能失敗,因為墻的原因,需要想辦法去下載nltk部分的內容,筆者這邊wsl子系統,可以使用代理,手動執行以下命令下載:uv run download_nltk.py
  • download_nltk.py其實就是download_deps.py的部分代碼, 我拷貝出來了,因為我其他的部分都安裝成功了
#!/usr/bin/env python3# PEP 723 metadata
# /// script
# requires-python = ">=3.10"
# dependencies = [
#   "huggingface-hub",
#   "nltk",
#   "argparse",
# ]
# ///
import nltk
import os
import argparseif __name__ == "__main__":parser = argparse.ArgumentParser(description='Download dependencies with optional China mirror support')parser.add_argument('--china-mirrors', action='store_true', help='Use China-accessible mirrors for downloads')args = parser.parse_args()local_dir = os.path.abspath('nltk_data')for data in ['wordnet', 'punkt', 'punkt_tab']:print(f"Downloading nltk {data}...")nltk.download(data, download_dir=local_dir)

3. 處理 pyicu 安裝失敗問題

uv syncpyicu 報錯的解決方案:

官方倉庫:https://gitlab.pyicu.org/main/pyicu

推薦執行以下步驟后重新安裝依賴:

# EITHER - from apt directly https://packages.debian.org/source/stable/pyicu
apt-get install python3-icu
# OR - from source
apt-get install pkg-config libicu-dev
# pip install --no-binary=:pyicu: pyicu

三、啟動依賴服務

4. 啟動基礎服務(MinIO、Elasticsearch、Redis、MySQL)

docker compose -f docker/docker-compose-base.yml up -d

5. 修改 /etc/hosts

添加以下內容,確保 conf/service_conf.yaml 中的 host 地址解析成功:

127.0.0.1       es01 infinity mysql minio redis sandbox-executor-manager

四、其他環境依賴

6. 安裝 jemalloc(如系統未安裝)

# ubuntu
sudo apt-get install libjemalloc-dev# centos
sudo yum install jemalloc

五、啟動后端服務

7. 啟動后端腳本

source .venv/bin/activate
export PYTHONPATH=$(pwd)
bash docker/launch_backend_service.sh

如果 .sh 無執行權限,執行:

chmod 744 docker/launch_backend_service.sh

8. 常見報錯處理

報錯內容:

import pyodbc ImportError: libodbc.so.2: cannot open shared object file: No such file or directory

解決方法:

sudo apt install libodbc2

六、啟動前端服務

9. 安裝依賴

cd web
npm install

10. 啟動開發服務器

npm run dev

七、調試模式說明(Debug)

閱讀源碼發現其實就是啟動 task_executor.py 和 ragflow_server.py 兩個服務,但是還有相關的環境變量不知道怎么設置

調試相關截圖:

在pycharm的debug配置中配置環境變量

可能報錯

#redis_port 無法解析

不知道原因:后面新建了個環境變量文件,把所有的注釋都去掉,就能用了


環境變量配置(Debug用)

配置文件示例(建議放入 .env 或手動 export):

DOC_ENGINE=elasticsearch
STACK_VERSION=8.11.3
ES_HOST=es01
ES_PORT=1200
ELASTIC_PASSWORD=infini_rag_flow
OS_PORT=1201
OS_HOST=opensearch01
OPENSEARCH_PASSWORD=infini_rag_flow_OS_01
KIBANA_PORT=6601
KIBANA_USER=rag_flow
KIBANA_PASSWORD=infini_rag_flow
MEM_LIMIT=8073741824
INFINITY_HOST=infinity
INFINITY_THRIFT_PORT=23817
INFINITY_HTTP_PORT=23820
INFINITY_PSQL_PORT=5432
MYSQL_PASSWORD=infini_rag_flow
MYSQL_HOST=mysql
MYSQL_DBNAME=rag_flow
MYSQL_PORT=5455
MINIO_HOST=minio
MINIO_CONSOLE_PORT=9001
MINIO_PORT=9000
MINIO_USER=rag_flow
MINIO_PASSWORD=infini_rag_flow
REDIS_HOST=redis
REDIS_PORT=6379
REDIS_PASSWORD=infini_rag_flow
SVR_HTTP_PORT=9380
RAGFLOW_IMAGE=infiniflow/ragflow:v0.19.0-slim
TIMEZONE='Asia/Shanghai'
DOC_BULK_SIZE=4
EMBEDDING_BATCH_SIZE=16
REGISTER_ENABLED=1
NLTK_DATA=/home/ubuntu/data/code/ragflow/nltk_data

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/86994.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/86994.shtml
英文地址,請注明出處:http://en.pswp.cn/web/86994.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Python基礎】12 閑談分享:Python用于無人駕駛的未來

引言:一個程序員的自動駕駛夢想 還記得2016年的那個秋天,我第一次坐進特斯拉Model S的駕駛座,體驗Autopilot功能。當方向盤開始自己轉動,車輛在高速公路上自動跟隨前車時,我的內心涌起了一種奇妙的感覺——這不就是我…

為什么js是單線程?

js單線程,同一時間只能做一件事 。js的單線程 主要與它的用途有關。作為瀏覽器腳本語言,js的主要用途是與用戶互動,以及操作DOM。這決定了它只能是單線程,否則會帶來很復雜的同步問題。如果js同時有兩個線程,一個線程在…

DVWA靶場通關筆記-文件包含(Medium級別 9種滲透方法)

目錄 一、文件包含 1、原因 2、危害 3、防范措施 二、代碼審計(Medium級別) 1、滲透準備 (1)配置php.ini (2)file1.php (3)file2.php (4)file3.php…

飛云翻倍布林(翻倍密碼系統四線布林版)雙安全系統+均價趨勢指標+日線周線MACD,組合操盤技術圖文分享

如上圖組合操盤套裝指標,主圖指標-翻倍密碼系統四線布林版-飛云翻倍布林。副圖指標1-均價趨勢指標,跟蹤市場均價走勢和趨勢;副圖指標2-日線周線MACD指標,跟蹤日線和周線兩個級別的MACD多空走勢以及共振與否。 主圖指標-飛云翻倍布…

《匯編語言:基于X86處理器》第6章 條件處理(1)

本章向程序員的匯編語言工具箱中引入一個重要的內容,使得編寫出來的程序具備作決策的功能。幾乎所有的程序都需要這種能力。首先,介紹布爾操作,由于能影響CPU狀態標志,它們是所有條件指令的核心。然后,說明怎樣使用演繹…

【分治思想】歸并排序 與 逆序對

歸并排序 歸并排序是一種分治算法,怎么分,怎么治? 分:通過遞歸不斷把數組分成兩半,直到每個子數組只剩 1 個元素(天然有序)治:把兩個已經排好序的子數組合并成一個有序數組。 把問…

SQL參數化查詢:防注入與計劃緩存的雙重優勢

在數據庫操作中,SQL參數化查詢(Parameterized Queries)是一種非常有效的技術,它不僅可以防止SQL注入攻擊,還可以提高數據庫查詢的效率,尤其是在與計劃緩存(Query Plan Caching)結合使…

【你怕一E1】- 孰輕孰重如何斷-組合問題的多種情形

摘要 本視頻講解了組合問題的多種情形,包括多選一、多選二、多選三以及分隊問題的解題方法。首先介紹了從不同人數中選人的不同選擇方式,如一百人中選一人有一百種選擇。隨后,詳細講解了有序思考方法在多選二問題中的應用,通過選隊長的方式列舉不同組合情況,并歸納出選擇規…

nginx反向代理的bug

nginx反向代理的bug 問題呈現 當我們配置反向代理的時候查詢error.log的時候我們發現以下的問題 2025/06/29 08:38:47 [error] 7#7: *2 open() “/usr/share/nginx/html/payed/notify” failed (2: No such file or directory), client: 192.168.98.1, server: localhost, r…

MyBatis 動態 SQL 與緩存機制深度解析

在Java持久層技術體系中,MyBatis憑借其靈活的SQL映射和強大的動態SQL能力,成為企業級應用開發的首選框架。本文從動態SQL核心語法、緩存實現原理、性能優化及面試高頻問題四個維度,結合源碼與工程實踐,系統解析MyBatis的核心特性與…

Nuxt 3 中實現跨組件通信方式總結:使用 Pinia、Provide/Inject 或 Props

在開發復雜的 Web 應用時,跨組件通信是一個常見的需求。Nuxt 3 提供了多種方式來實現這一點,包括使用狀態管理工具(如 Pinia)、Vue 的 provide/inject 機制以及傳統的 props 傳遞。本文將詳細介紹這三種方法,并通過一個…

Java ArrayList 擴容機制

一、ArrayList 簡介 ArrayList 是 Java 集合框架中基于數組實現的可變長度列表,其核心特性是: 支持隨機訪問(通過索引)支持動態擴容插入/刪除效率較低(非尾部操作) 二、底層數據結構 // JDK 11 transien…

C++面試題精講系列之數組排序

數組排序是我們經常遇到的筆試題目,給大家盤一下這題到底想考察什么? // 考題如下 void main() {int arr[4] {26,28,24,11};// 請實現一個sortArray函數,對數組arr進行從小到大排序 }考點1:數組做函數參數如何傳遞參?…

Windows10/11 輕度優化 純凈版,12個版本!

系統介紹 鏡像包均基于微軟官方原版系統精心制作,確保系統的原汁原味與穩定性。Windows 10/11,都集成了最新的補丁。版本選對,一鍵安裝到位,全自動無人值守安裝模式。 系統特點 系統進行優化提供了12個系統版本集成了運行庫、…

開發工具IDEA

開發工具IDEA 開發調試(debug)Maven配置三級目錄 開發調試(debug) 史上最全的 IDEA Debug 調試技巧(超詳細案例) Maven配置 idea全局Maven配置 IDEA中Maven配置詳解 有些時候不要配置maven_home這些環境…

GitHub Actions與AWS OIDC實現安全的ECR/ECS自動化部署

引言 在現代云原生應用開發中,實現安全、高效的CI/CD流程至關重要。本文將詳細介紹如何利用GitHub Actions和AWS OIDC(OpenID Connect)構建一個無需長期憑證的安全部署管道,將容器化應用自動部署到Amazon ECR和ECS服務。 架構概述 整個解決方案的架構包含三個主要部分:…

一、MongoDB安裝-二進制安裝

下載tar包 wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-7.0.21.tgz wget https://downloads.mongodb.com/compass/mongosh-2.5.3-linux-x64.tgz安裝 解壓 tar xf mongodb-linux-x86_64-rhel70-7.0.21.tgz cp mongodb-linux-x86_64-rhel70-7.0.21/bi…

學習日志03 ETF 基礎數據可視化分析與簡易管理系統

1 代碼的選擇和改進 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from ipywidgets import (AppLayout, Dropdown, Button, Output, VBox, HBox, Label, Layout, SelectMultiple,IntSlider, FloatSlider, Checkbox, Text, Select) from IPytho…

[Python] -基礎篇7-新手常見Python語法錯誤及解決方案

Python 以其簡潔明了的語法引人入勝,但對于初學者而言,仍然容易遭遇各類語法錯誤。本文總結了 Python 語言日常編寫中最常見的語法錯誤類型,并提供解決方案和正確寫法,幫助新手快速突破編程路上的一道道埋伏。 1. 拼寫錯誤 (SyntaxError) 這是最基本也最常見的錯誤類型。…

位運算實戰:數值構造終極優化

位運算優化實戰:數值構造問題詳解 今天我們將深入分析一個有趣的位運算優化問題,這個問題展示了如何通過巧妙的預處理和貪心算法來高效解決數值構造問題。 問題背景與定義 給定一個初始值x(0 ≤ x ≤ m)和一系列位運算操作&…