start
????????為了增強多跳問答,RAGFlow在數據提取和索引之間增加了一個知識圖譜構建步驟,如下面所示。這一步驟會從您指定的分塊方法生成的現有塊中創建額外的塊。
????????從v0.16.0版本開始,RAGFlow支持在知識庫上構建知識圖譜,允許你在知識庫內的多個文件之間構建統一的圖譜。當新上傳的文件開始解析時,生成的圖譜會自動更新。
????????WARNING
????????????????構建知識圖譜需要大量內存、計算資源和tokens。
Scenarios
????????知識圖譜在涉及嵌套邏輯的多跳問答中特別有用。當在具有復雜實體和關系的書籍或作品上進行問題回答時,它們比傳統的提取方法表現更佳。
????????注意:RAPTOR(遞歸抽象處理用于樹狀組織檢索)也可以用于多跳問答任務。詳情請參見啟用RAPTOR。您可以使用任一方法或兩者結合,但確保理解涉及的內存、計算和標記成本。
Prerequisites
????????系統的默認聊天模型用于生成知識圖譜。在繼續之前,請確保已正確配置聊天模型。
Configurations
Entity types (Required)
????????要從知識庫中提取的實體類型。默認類型為:組織、人員、事件和類別。您可以添加或刪除類型以適合您的特定知識庫。
Method
????????構建知識圖譜的方法:
????????????????? 通用:使用GraphRAG提供的提示來提取實體和關系。?https://github.com/microsoft/graphraghttps://github.com/microsoft/graphrag
????????????????? 輕量級:(默認)使用LightRAG提供的提示來提取實體和關系。此選項消耗更少的令牌、內存和計算資源。
https://github.com/HKUDS/LightRAGhttps://github.com/HKUDS/LightRAG
Entity resolution
????????是否啟用實體解析。你可以將其視為一個實體去重開關。當啟用時,LLM將合并相似的實體——例如,'2025'和'2025年',或'IT'和'信息技術'——以構建更有效的圖譜。
?????????(默認)禁用實體解析。
?????????啟用實體解析。此選項會消耗更多token。
Community report generation
????????在知識圖譜中,社區是一組通過關系連接的實體。您可以讓大語言模型為每個社區生成摘要,稱為社區報告。更多信息請參見此處。 這表示是否生成社區報告GraphRAG: Improving global search via dynamic community selection - Microsoft Research:
??????????? ? 生成社區報告。此選項會消耗更多令牌。
??????????? ? (默認)不生成社區報告。
Procedure?
?
? ? ? ? 1、在知識庫的配置頁面,打開提取知識圖譜或根據需要調整其設置,并點擊保存以確認更改。
???????????????默認情況下,從現在開始上傳的文件在解析時將自動使用這些知識圖譜設置。
???????????????在此之前解析的文件將保留原有的知識圖譜設置。
? ? ? ? 2、知識庫的知識圖譜不會自動更新,直到新上傳的文件被解析。一旦創建了知識圖譜,它將在配置下顯示。
????????3、點擊知識圖譜查看生成的圖譜詳情。
? ? ? ? 4、要使用創建的知識圖譜,請執行以下任一操作:
????????????????在聊天配置對話框中,點擊助手設置選項卡添加相應的知識庫,并點擊提示引擎選項卡打開使用知識圖譜開關;
????????????????如果您使用的是代理,點擊檢索代理組件指定知識庫并打開使用知識圖譜開關。
Frequently asked questions
1、在我的知識庫中,我可以為不同的文件設置不同的知識圖譜嗎?
????????是的,你可以。每個知識庫只會生成一個圖。在提取圖的過程結束時,你的文件中的較小圖會合并成一個大的統一圖。
2、知識圖譜在刪除相關文件時不會自動更新,
????????直到新上傳的文檔被解析才會更新。
3、如何刪除生成的知識圖譜?
????????要刪除生成的知識圖譜,請刪除知識庫中所有相關文件。盡管知識圖譜條目仍然可見,但圖譜實際上已被刪除。
4、創建的知識圖譜存儲在哪里?
????????創建的知識圖譜的所有片段都存儲在RAGFlow的文檔引擎中:Elasticsearch或Infinity。
原文地址:
????????Construct knowledge graph | RAGFlow?