【Ragflow】22.RagflowPlus(v0.3.0):用戶會話管理/文件類型拓展/諸多優化更新

概述

在歷經三周的階段性開發后,RagflowPlus順利完成既定計劃,正式發布v0.3.0版本。

開源地址:https://github.com/zstar1003/ragflow-plus

新功能

1. 用戶會話管理

在后臺管理系統中,新增用戶會話管理菜單。在此菜單中,可以查看每個用戶的聊天歷史信息。

用戶會話管理菜單功能演示

2. 知識庫圖像預覽顯示

在前臺知識庫管理界面中,增加了一塊關聯圖片顯示區域

如果chunk塊具有關聯圖片,會在此區域顯示。

關聯圖像顯示示例

3. 解析文件類型拓展

v0.2.1版本中,解析僅支持三種簡單類型:pdf、word、ppt。

v0.3.0版本對文件類型進行進一步拓展,目前支持各種主流文件類型,包括:pdf、word、ppt、excel、txt、md、html、jpg、png、bmp。

其中,對于excel類型,做了單獨的處理優化。

每個表格會單獨將每行作為一個獨立的chunk塊,同時會自動添加表格表頭。

學生花名單-excel表格解析結果示例

上圖展現了一個學生花名單的解析效果,通過自動添加表頭,可以保證每列信息的準確含義,從而能夠準確問答檢索。

比如,我問某學生的學號,它能夠找到正確的分塊,從而進行回答。

信息查詢問答實例:查詢某學生的學號

此外,對于圖像類型的文件,也能正常解析。

圖像文件解析示例

4. 聊天對話字體動態調節

在前臺聊天界面中,額外添加了一個設置按鈕,可以動態調節聊天窗口顯示的字體大小。

經測試,使用docker部署時,該功能可能不生效,仍需進行排查修復。

改進優化

1. 信息自定義排序

在后臺管理系統中,大部分表格都配置了排序功能。

這樣可以根據條件(如創建時間)進行排序,從而快速篩選出記錄。

在向知識庫添加文件時,也可以通過該方式,快速添加最新上傳的文件內容。

點擊表頭,可升序/降序排列信息

2. 知識庫創建優化

在知識庫創建界面中,新增創建人選項,可以在已有用戶中添加。

通過該選項,可為不同用戶單獨添加知識庫。

新建知識庫時,指定創建人

同時,對于每個知識庫,新增修改選項,從而可以讓知識庫權限在個人和團隊中自由設定。

知識庫權限修改

3. 嵌入模型適配硅基流動API

v0.2.1版本中,后臺解析并不支持配置的在線嵌入模型。

v0.3.0版本中,增加了對硅基流動平臺的模型適配。

硅基流動平臺的bge-m3可免費使用

如果不想在本地下載embedding模型,可以直接在硅基流動平臺上,注冊密鑰,配置使用。

硅基流動地址:https://cloud.siliconflow.cn/i/J8xf97VO

具體修改方式是先用初始用戶(第一個創建的用戶)登錄前臺系統,配置好模型信息。

前臺配置模型信息

配置完成后,后臺測試嵌入模型配置時,信息自動更新。

后臺配置模型連接測試

需要注意的是,對于同一個知識庫,不能混用不同的解析模型,否則會出現異常。

為防止誤操作,該版本強制統一嵌入模型為bge-m3,使用其它嵌入模型將可能無法正常工作。

4. 修復用戶人數>10人時,團隊添加成員顯示不全問題

當前版本,團隊中可自由添加所有成員,且默認采用倒序排序,可以快速選擇新用戶。

5. 修復用戶創建時間異常問題

設置時區為東八區(UTC+8時區),解決用戶創建時間顯示異常問題。

6. 移除vllm的docker默認配置

docker配置文件中,移除vllm的默認容器配置,因為 vllm 默認拉取使用的模型是 float16 精度,導致眾多用戶因顯存不足無法正常使用。

對于個人用戶,推薦使用ollama,默認拉取的模型為 int4 精度,比較友好。

7. MinerU版本更新

采用當前最新版本的MinerU(v1.3.11),性能較先前版本會略有提升。

8. minio地址可編輯

docker/.env文件中,新增MINIO_VISIT_HOST用于動態控制minio上傳文件時的ip地址。

如需將解析圖片配置公網訪問,可修改此地址為公網地址。

9. 其它優化

其它細碎更新點,不逐一羅列,具體可見倉庫Commits記錄。

下版本開發計劃

下版本的工作重點將圍繞臨時文件上傳和文檔撰寫兩個功能項進行優化。

文件上傳優化方向

在原版的 ragflow 中,用戶在問答界面中,上傳文件后,文件會自動將文件添加進知識庫,并自動進行解析。

v0.3.0中,臨時移除上傳文件功能

ragflow-plus的改進思路是:將用戶上傳的文件進行臨時解析,插入緩存數據庫,而不是直接塞入存儲庫中。

根據解析得到的文件文本信息,作為問答參考的一部分。

文檔撰寫優化方向

文檔撰寫主要有以下優化方向:

  • 1.文檔模板支持自定義

  • 2.文檔內容支持暫存

  • 3.文檔撰寫時,調用單獨的模型問答接口

  • 4.支持問答結果的流式輸出

  • 5.導出word時,支持圖文內容

該方向部分功能原本計劃在此版本完成,但鑒于鴿🕊得過久,移到下版本在做。

問題反饋

在使用過程中,如遇到問題,可以在開源倉庫中提交issue。

提交同時,推薦附上容器日志信息,比如在后臺管理系統中,遇到解析失敗的問題,可以查看后臺容器日志信息:

docker logs ragflowplus-management-backend

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/81228.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81228.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/81228.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

c++重要知識點匯總(不定期更新)

前言 真心希望各位dalao點贊收藏~ 樹狀數組 作用:高效求出區間前綴和,允許進行修改操作。 舉個栗子: 剛開始有8項,分別為1-8。 首先構建二叉樹: 1-8/ |/ |/ |/ |/ |1-4 5-8/ | / |/ | / |1-…

Predict Podcast Listening Time-(回歸+特征工程+xgb)

Predict Podcast Listening Time 題意: 給你沒個播客的信息,讓你預測觀眾的聆聽時間。 數據處理: 1.構造新特征收聽效率進行分組 2.對數據異常處理 3.對時間情緒等進行數值編碼 4.求某特征值求多項式特征 5.生成特征組合 6.交叉驗證并enc…

Class類的詳細說明

Class類的詳細說明 Class 類是Java反射機制的核心,每個Java類或接口在JVM中都有一個對應的 Class 對象,用于表示該類的元數據(如類名、方法、字段、構造器等)。以下是其核心知識點: 1. 獲取Class對象的三種方式 方式…

[逆向工程]C++實現DLL注入:原理、實現與防御全解析(二十五)

[逆向工程]C實現DLL注入:原理、實現與防御全解析(二十五) 引言 DLL注入(DLL Injection)是Windows系統下實現進程間通信、功能擴展、監控調試的核心技術之一。本文將從原理分析、代碼實現、實戰調試到防御方案&#x…

【ROS2實戰】在中國地區 Ubuntu 22.04 上安裝 ROS 2 Humble 教程

本文介紹如何在中國大陸環境下順利安裝 ROS 2 Humble,包括使用清華鏡像源、解決 locale 和 GPG 密鑰問題、安裝 ROS 軟件包以及配置自動環境加載。 🌟 ROS 2 版本簡介 ROS 2 是機器人操作系統的第二代版本,目前主要有兩個長期支持&#xff0…

嵌入式學習筆記 - STM32 ADC 模塊工作模式總結

ADC 模式總結: 一 單ADC模式(是指ADC1,ADC2,ADC3中只有一個ADC被使用) ①單通道: 非連續模式:非連續的意思就是單次,一次轉換完成后就停止轉換,除非再次被軟件或者被外部觸發啟動&#xff1b…

Python訓練打卡Day26

函數專題1:函數定義與參數 知識點回顧: 函數的定義變量作用域:局部變量和全局變量函數的參數類型:位置參數、默認參數、不定參數傳遞參數的手段:關鍵詞參數傳遞參數的順序:同時出現三種參數類型時 到目前為…

使用Docker部署Nacos

sudo systemctl start docker sudo systemctl enable docker docker --version 步驟 2: 拉取 Nacos Docker 鏡像 拉取 Nacos 鏡像: 你可以從 Docker Hub 上拉取官方的 Nacos 鏡像,使用以下命令: docker pull nacos/nacos-server 這會從 …

Ubuntu 添加系統調用

實驗內容 通過內核編譯法添加一個不用傳遞參數的系統調用,其功能可自定義。 (1)添加系統調用號,系統會根據這個號找到syscall_table中的相應表項。具體做法是在syscall_64.tbl文件中添加系統調用號和調用函數的對應關系。 &#…

Javascript:WebAPI

獲取網頁元素 queryselector queryselector是 JavaScript 中用于選擇 DOM 元素的重要方法,它允許使用 CSS 選擇器語法來查找頁面中的元素。 一般queryselector獲取的元素都是html中第一個選擇器的元素 支持選擇器類型:類選擇器(.class) &#xff0c…

十二、Hive 函數

作者:IvanCodes 日期:2025年5月1日 專欄:Hive教程 在數據處理的廣闊天地中,我們常常需要對數據進行轉換、計算、清洗或提取特定信息。Hive 提供了強大的內置運算符和豐富的內置函數庫,它們就像魔法師手中的魔法棒&…

Linux之Nginx安裝及配置原理篇(一)

Nginx安裝及配置 前情回顧 首先針對Nginx進程模型,我們回顧一下它的原理機制,我們知道它是通過Master通過fork分發任務節點給予work節點,然后work節點觸發了event事件,之后通過一個access_muttex互斥鎖,來單線程調用我…

嵌入式培訓之數據結構學習(五)棧與隊列

一、棧 (一)棧的基本概念 1、棧的定義: 注:線性表中的棧在堆區(因為是malloc來的);系統中的棧區存儲局部變量、函數形參、函數返回值地址。 2、棧頂和棧底: 允許插入和刪除的一端…

深度學習---知識蒸餾(Knowledge Distillation, KD)

一、知識蒸餾的本質與起源 定義: 知識蒸餾是一種模型壓縮與遷移技術,通過將復雜高性能的教師模型(Teacher Model)所學的“知識”遷移到輕量級的學生模型(Student Model),使學生模型在參數量和計…

ARP Detection MAC-Address Static

一、ARP Detection(ARP檢測) ? 定義: ARP檢測是一種防止ARP欺騙攻擊的安全機制。它通過監控或驗證網絡中的ARP報文,來判斷是否存在偽造的ARP信息。 🔍 工作原理: 網絡設備(如交換機&#xf…

基于 Python 的界面程序復現:標準干涉槽型設計計算及仿真

基于 Python 的界面程序復現:標準干涉槽型設計計算及仿真 在工業設計與制造領域,刀具的設計與優化是提高生產效率和產品質量的關鍵環節之一。本文將介紹如何使用 Python 復現一個用于標準干涉槽型設計計算及仿真的界面程序,旨在幫助工程師和…

Python繪制南丁格爾玫瑰圖:從入門到實戰

Python繪制南丁格爾玫瑰圖:從入門到實戰 引言 南丁格爾玫瑰圖(Nightingale Rose Chart),也被稱為極區圖(Polar Area Chart),是一種獨特的數據可視化方式。這種圖表由弗洛倫斯南丁格爾&#xff…

計算機操作系統概要

不謀萬世者,不?謀?時。不謀全局者 ,足謀?域 。 ——陳澹然《寤?》《遷都建藩議》 操作系統 一.對文件簡單操作的常用基礎指令 ls ls 選項 目錄或?件名:羅列當前?錄下的?件 -l:以長格式顯示?件和?錄的詳細信息 -a 或 --all&…

<PLC><視覺><機器人>基于海康威視視覺檢測和UR機械臂,如何實現N點標定?

前言 本系列是關于PLC相關的博文,包括PLC編程、PLC與上位機通訊、PLC與下位驅動、儀器儀表等通訊、PLC指令解析等相關內容。 PLC品牌包括但不限于西門子、三菱等國外品牌,匯川、信捷等國內品牌。 除了PLC為主要內容外,相關設備如觸摸屏(HMI)、交換機等工控產品,如果有…

從專家編碼到神經網絡學習:DTM 的符號操作新范式

1st author: Paul Soulos paper: Differentiable Tree Operations Promote Compositional Generalization ICML 2023 code: psoulos/dtm: Differentiable Tree Machine 1. 問題與思路 現代深度學習在連續向量空間中取得了巨大成功,然而在處理具有顯式結構&#x…