【Ragflow】27.RagflowPlus(v0.4.1):小版本迭代,問題修復與功能優化

概述

RagflowPlus v0.4.0 在發布后,收到了積極的反饋,同時也包含一些問題。

本次進行一輪小版本更新,發布 v0.4.1 版本,對已知問題進行修復,并對部分功能進行進一步優化。

開源地址:https://github.com/zstar1003/ragflow-plus

更新方法

下載倉庫最新代碼:

git clone https://github.com/zstar1003/ragflow-plus.git

使用docker啟動:

# cpu模式
docker compose -f docker/docker-compose.yml up -d
# gpu模式
docker compose -f docker/docker-compose_gpu.yml up -d

首次啟動會自動拉取最新版本鏡像。

問題修復

1.修復解析excel文件時,依賴缺失的問題(issue#149)

2.修復解析pdf文件時,遇到空內容表格,出現異常的問題。

功能優化

1. 圖像顯示路徑優化

之前的版本中,將圖像的存儲路徑硬編碼為es屬性中,導致在局域網環境下訪問時,容易出現圖片不顯示的情況。

v0.4.0版本中,易出現此問題

在本版本中,對每張圖片的協議、ip地址和在minio中的相對路徑進行解耦

在es中,只存儲圖片的相對路徑地址,具體的訪問ip地址可通過docker/.env中的MINIO_VISIT_HOST變量進行控制。

es中解析塊屬性可視化

通過這樣的修改,可使問答時,圖像穩定顯示。

2. 容器連接通路優化

由于對minio的訪問地址進行解耦,在后臺管理中進一步修改連接配置database.py文件:

if is_running_in_docker():MYSQL_HOST = "mysql"MYSQL_PORT = 3306MINIO_HOST = "minio"MINIO_PORT = 9000ES_HOST = "es01"ES_PORT = 9200REDIS_HOST = "redis"REDIS_PORT = 6379

在docker環境中,直接通過服務名進行訪問,而不再像之前的版本那樣通過宿主機再間接訪問。

之前版本訪問路徑(藍色線條)現版本訪問路徑(紅色箭頭)

這樣修改,有效避免了用戶在上傳文件時,容易出現超時未響應的情況,連接速度更快更穩定。

3. 圖片插入位置優化

在之前的版本中,所有相關圖像會在問答末尾一并輸出。

本次對圖像輸出進行了改良,現在圖像會出現在第一個相關塊的引用位置,可在問答中間輸出。

如有引用標記,該引用塊有關聯圖像,則將其顯示在下方

4. 增加文檔撰寫模式的緩存

在文檔撰寫模塊中,新增了當前編輯文檔內容的自動保存功能。

通過瀏覽器自帶的Local storage,實現對每間隔1s對內容進行無感保存。

切換標簽或刷新頁面后,之前編輯的內容依然存在,不會消失。

刷新界面,文檔界面依然存在

5. word導出支持自動圖片下載插入

在文檔撰寫模塊中,導出word文件時,會自動下載編輯區的圖像塊連接,實現圖片的自動下載插入。

導出word效果

6. Top N上限增加

在聊天配置中,有一個Top N的選項,用來控制大模型能實際看到的前N個解析塊數量。

原始默認的Top N上限為30,因為在每個塊內容較多的情況下,如果塞入大模型的參考內容過多,會超過模型的最大輸入上限。

考慮到部分用戶應用的內容查詢業務,每個塊的內容很少,查詢數量很多,因此增加Top N的上限為100,默認保持8不變。

當前版本可上調

問題反饋須知

當前的每輪版本更新都修改文件解析的邏輯,因此,讀者在試用反饋問題時,建議新建知識庫進行解析。

在后臺管理系統中,新建知識庫

通過知識庫隔離,可防止不同版本的解析文件混雜在相同知識庫中,造成異常情況。

總結

此次更新后,在局域網服務器中進行了一輪測試,目前已基本能滿足個人應用場景的使用需求。

后續會將精力投入到大模型相關的基建拓展研究中,比如,embedding模型的效果如何評估,如何微調大模型。

之前定下的Ragflow-Plus的更新計劃將會暫緩推進,如果有開發經驗的讀者想繼續對此項目進行貢獻,歡迎提交PR。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908666.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908666.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908666.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【hadoop】Flink安裝部署

一、單機模式 步驟: 1、使用XFTP將Flink安裝包flink-1.13.5-bin-scala_2.11.tgz發送到master機器的主目錄。 2、解壓安裝包: tar -zxvf ~/flink-1.13.5-bin-scala_2.11.tgz 3、修改文件夾的名字,將其改為flume,或者創建軟連接…

Linux 下 ChromeDriver 安裝

個人博客地址:Linux 下 ChromeDriver 安裝 | 一張假鈔的真實世界 Selenium 是一個用于 Web 應用程序測試的工具。可以通過它驅動瀏覽器執行特定的操作,如點擊、下滑、資源加載與渲染等。該工具在爬蟲開發中也非常有幫助。Selenium 需要通過瀏覽器驅動操…

Canal環境搭建并實現和ES數據同步

作者:田超凡 日期:2025年6月7日 Canal安裝,啟動端口11111、8082: 安裝canal-deployer服務端: https://github.com/alibaba/canal/releases/1.1.7/canal.deployer-1.1.7.tar.gz cd /opt/homebrew/etc mkdir canal…

STM32使用土壤濕度傳感器

1.1 介紹: 土壤濕度傳感器是一種傳感裝置,主要用于檢測土壤濕度的大小,并廣泛應用于汽車自動刮水系統、智能燈光系統和智能天窗系統等。傳感器采用優質FR-04雙料,大面積5.0 * 4.0厘米,鍍鎳處理面。 它具有抗氧化&…

鎖的藝術:深入淺出講解樂觀鎖與悲觀鎖

在多線程和分布式系統中,數據一致性是一個核心問題。鎖機制作為解決并發沖突的重要手段,被廣泛應用于各種場景。樂觀鎖和悲觀鎖是兩種常見的鎖策略,它們在設計理念、實現方式和適用場景上各有特點。本文將深入探討樂觀鎖和悲觀鎖的原理、實現…

Jinja2深度解析與應用指南

1. 概念與用途 1.1 核心概念 Jinja2是Python生態中功能強大的模板引擎,采用邏輯與表現分離的設計思想: 模板:包含靜態內容和動態占位符的文本文件(.j2后綴)渲染:將模板與數據結合生成最終文本的過程上下…

Ubuntu20.04中 Redis 的安裝和配置

Ubuntu20.04 中 Redis 的安裝和配置 Ubuntu 安裝 MySQL 及其配置 1. Redis 的安裝 更新系統包列表并安裝 Redis : # 更新包管理工具 sudo apt update# -y:自動確認所有提示(非交互式安裝) sudo apt install -y redis-server測…

Sklearn 機器學習 缺失值處理 填充數據列的缺失值

??親愛的技術愛好者們,熱烈歡迎來到 Kant2048 的博客!我是 Thomas Kant,很開心能在CSDN上與你們相遇~?? 本博客的精華專欄: 【自動化測試】 【測試經驗】 【人工智能】 【Python】 ??使用 Scikit-learn 處理數據缺失值的完整指南 在機器學習項目中,數據缺失是不可避…

Unity中如何播放視頻

1.創建一個原始圖像并調整布局平鋪整個畫布 2.創建自定義紋理并調整自定義紋理大小 3.添加視頻播放組件 4.將準備好的視頻素材拖入到視頻剪輯中 5.將自定義紋理拖入到目標紋理中 6.將自定義紋理拖入到原始圖像的紋理中 最后運行游戲,即可播放視頻 總結:

Spring通用類型轉換的實現原理

Spring通用類型轉換的實現原理 設計思路實現邏輯ConversionService&#xff1a;類型轉換服務入口ConverterRegister&#xff1a;轉換器注冊接口GenericConversionService1. Map<ConvertiblePair, GenericConverter> converters2. canConvert() 與 convert()&#xff1a;服…

紅黑樹完全指南:為何工程都用它?原理、實現、場景、誤區全解析

紅黑樹完全指南&#xff1a;為何工程都用它&#xff1f;原理、實現、場景、誤區全解析 作者&#xff1a;星之辰 標簽&#xff1a;#紅黑樹 #平衡二叉查找樹 #工程實踐 #數據結構 #面試寶典 引子&#xff1a;工程師的“性能焦慮”與樹的進化史 你以為樹只是算法題里的配角&#…

阿里云 RDS mysql 5.7 怎么 添加白名單 并鏈接數據庫

阿里云 RDS mysql 5.7 怎么 添加白名單 并鏈接數據庫 最近幫朋友 完成一些運維工作 &#xff0c;這里記錄一下。 文章目錄 阿里云 RDS mysql 5.7 怎么 添加白名單 并鏈接數據庫最近幫朋友 完成一些運維工作 &#xff0c;這里記錄一下。 阿里云 RDS MySQL 5.7 添加白名單1. 登錄…

Psychopy音頻的使用

Psychopy音頻的使用 本文主要解決以下問題&#xff1a; 指定音頻引擎與設備&#xff1b;播放音頻文件 本文所使用的環境&#xff1a; Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音頻配置 Psychopy文檔鏈接為Sound - for audio playback — Psy…

分布式互斥算法

1. 概述&#xff1a;什么是分布式互斥 假設有兩個小孩想玩同一個玩具&#xff08;臨界資源&#xff09;&#xff0c;但玩具只有一個&#xff0c;必須保證一次只有一個人能夠玩。當一個小孩在玩時&#xff0c;另一個小孩只能原地等待&#xff0c;直到玩完才能輪到自己。這就是 …

[創業之路-410]:經濟學 - 國富論的核心思想和觀點,以及對創業者的啟發

一、國富論的核心思想和觀點 《國富論》全稱為《國民財富的性質和原因的研究》&#xff0c;由英國經濟學家亞當斯密于1776年出版&#xff0c;是經濟學領域的經典之作&#xff0c;其核心思想和觀點對現代經濟學的發展產生了深遠影響&#xff0c;具體如下&#xff1a; 勞動價值…

Tavily 技術詳解:為大模型提供實時搜索增強的利器

目錄 &#x1f680; Tavily 技術詳解&#xff1a;為大模型提供實時搜索增強的利器 &#x1f9e9; 為什么需要 Tavily&#xff1f; &#x1f50d; Tavily 是什么&#xff1f; 核心特性&#xff1a; &#x1f4e6; Tavily 在 RAG 架構中的位置 &#x1f9ea; 示例&#xff…

欣佰特科技亮相2025張江具身智能開發者大會:呈現人形機器人全鏈條解決方案

5月29日 &#xff0c;2025年張江具身智能開發者大會在上海落下帷幕。欣佰特科技作為專注人形機器人與具身智能領域的創新企業&#xff0c;攜一系列前沿產品與解決方案參展&#xff0c;與全球行業專家、企業共同探討技術落地路徑&#xff0c;展現其在具身智能領域的技術積累與場…

@Prometheus 監控-MySQL (Mysqld Exporter)

文章目錄 **Prometheus 監控 MySQL ****1. 目標****2. 環境準備****2.1 所需組件****2.2 權限要求** **3. 部署 mysqld_exporter****3.1 下載與安裝****3.2 創建配置文件****3.3 創建 Systemd 服務****3.4 驗證 Exporter** **4. 配置 Prometheus****4.1 添加 Job 到 prometheus…

MCP Resource模塊詳解

MCP Resource模塊詳解 摘要 MCP Resource模塊是模型上下文協議的核心組件&#xff0c;通過標準化URI接口為AI模型提供安全可控的只讀數據訪問能力。其核心設計包括數據隔離架構和客戶端驅動的訪問控制&#xff0c;支持文本/二進制編碼格式&#xff0c;適用于配置文件讀取、數據…

Docker 容器化基礎:鏡像、容器與倉庫的本質解析

Docker 概念與容器化技術 Docker 是一種容器化平臺&#xff0c;能夠將應用程序及其依賴項打包成一個容器&#xff0c;確保在任何環境中都能一致運行。容器化技術通過操作系統級別的虛擬化&#xff0c;為應用程序提供了一個獨立的運行環境。 容器化技術的核心優勢 一致性&…