初級 RAG
-
初級 RAG 的定義
初級 RAG 研究范式代表了最早的方法論,在 ChatGPT 廣泛采用后不久就取得了重要地位。初級 RAG 遵循傳統的流程,包括索引創建(Indexing)、檢索(Retrieval)和生成(Generation),常常被描繪成一個“檢索—讀取”框架,其工作流包括三個關鍵步驟:
-
語料庫被劃分為離散的塊,然后使用編碼器模型構建向量索引。
-
RAG 根據查詢與索引塊(Indexed Chunk)的向量相似度識別并對塊進行檢索。
-
模型根據檢索塊(Retrieved Chunk)中獲取的上下文信息生成答案。
-
初級 RAG 的局限性
初級 RAG 在三個關鍵領域面臨著顯著挑戰:"檢索"、"生成"和"增強"。