概述
在歷經三周的階段性開發后,RagflowPlus
順利完成既定計劃,正式發布v0.3.0
版本。
開源地址:https://github.com/zstar1003/ragflow-plus
新功能
1. 用戶會話管理
在后臺管理系統中,新增用戶會話管理菜單。在此菜單中,可以查看每個用戶的聊天歷史信息。
2. 知識庫圖像預覽顯示
在前臺知識庫管理界面中,增加了一塊關聯圖片顯示區域。
如果chunk塊具有關聯圖片,會在此區域顯示。
3. 解析文件類型拓展
v0.2.1
版本中,解析僅支持三種簡單類型:pdf、word、ppt。
v0.3.0
版本對文件類型進行進一步拓展,目前支持各種主流文件類型,包括:pdf、word、ppt、excel、txt、md、html、jpg、png、bmp。
其中,對于excel類型,做了單獨的處理優化。
每個表格會單獨將每行作為一個獨立的chunk塊,同時會自動添加表格表頭。
上圖展現了一個學生花名單的解析效果,通過自動添加表頭,可以保證每列信息的準確含義,從而能夠準確問答檢索。
比如,我問某學生的學號,它能夠找到正確的分塊,從而進行回答。
此外,對于圖像類型的文件,也能正常解析。
4. 聊天對話字體動態調節
在前臺聊天界面中,額外添加了一個設置按鈕,可以動態調節聊天窗口顯示的字體大小。
經測試,使用docker部署時,該功能可能不生效,仍需進行排查修復。
改進優化
1. 信息自定義排序
在后臺管理系統中,大部分表格都配置了排序功能。
這樣可以根據條件(如創建時間)進行排序,從而快速篩選出記錄。
在向知識庫添加文件時,也可以通過該方式,快速添加最新上傳的文件內容。
2. 知識庫創建優化
在知識庫創建界面中,新增創建人
選項,可以在已有用戶中添加。
通過該選項,可為不同用戶單獨添加知識庫。
同時,對于每個知識庫,新增修改
選項,從而可以讓知識庫權限在個人和團隊中自由設定。
3. 嵌入模型適配硅基流動API
v0.2.1
版本中,后臺解析并不支持配置的在線嵌入模型。
在v0.3.0
版本中,增加了對硅基流動平臺的模型適配。
如果不想在本地下載embedding模型,可以直接在硅基流動平臺上,注冊密鑰,配置使用。
硅基流動地址:https://cloud.siliconflow.cn/i/J8xf97VO
具體修改方式是先用初始用戶(第一個創建的用戶)登錄前臺系統,配置好模型信息。
配置完成后,后臺測試嵌入模型配置時,信息自動更新。
需要注意的是,對于同一個知識庫,不能混用不同的解析模型,否則會出現異常。
為防止誤操作,該版本強制統一嵌入模型為bge-m3,使用其它嵌入模型將可能無法正常工作。
4. 修復用戶人數>10人時,團隊添加成員顯示不全問題
當前版本,團隊中可自由添加所有成員,且默認采用倒序排序,可以快速選擇新用戶。
5. 修復用戶創建時間異常問題
設置時區為東八區(UTC+8時區
),解決用戶創建時間顯示異常問題。
6. 移除vllm的docker默認配置
docker配置文件中,移除vllm的默認容器配置,因為 vllm 默認拉取使用的模型是 float16 精度,導致眾多用戶因顯存不足無法正常使用。
對于個人用戶,推薦使用ollama,默認拉取的模型為 int4 精度,比較友好。
7. MinerU版本更新
采用當前最新版本的MinerU(v1.3.11),性能較先前版本會略有提升。
8. minio地址可編輯
在docker/.env
文件中,新增MINIO_VISIT_HOST
用于動態控制minio上傳文件時的ip地址。
如需將解析圖片配置公網訪問,可修改此地址為公網地址。
9. 其它優化
其它細碎更新點,不逐一羅列,具體可見倉庫Commits記錄。
下版本開發計劃
下版本的工作重點將圍繞臨時文件上傳和文檔撰寫兩個功能項進行優化。
文件上傳優化方向
在原版的 ragflow 中,用戶在問答界面中,上傳文件后,文件會自動將文件添加進知識庫,并自動進行解析。
ragflow-plus的改進思路是:將用戶上傳的文件進行臨時解析,插入緩存數據庫,而不是直接塞入存儲庫中。
根據解析得到的文件文本信息,作為問答參考的一部分。
文檔撰寫優化方向
文檔撰寫主要有以下優化方向:
-
1.文檔模板支持自定義
-
2.文檔內容支持暫存
-
3.文檔撰寫時,調用單獨的模型問答接口
-
4.支持問答結果的流式輸出
-
5.導出word時,支持圖文內容
該方向部分功能原本計劃在此版本完成,但鑒于鴿🕊得過久,移到下版本在做。
問題反饋
在使用過程中,如遇到問題,可以在開源倉庫中提交issue。
提交同時,推薦附上容器日志信息,比如在后臺管理系統中,遇到解析失敗的問題,可以查看后臺容器日志信息:
docker logs ragflowplus-management-backend