開篇
“解決知識庫幻覺”系列還在繼續,這是因為:如果只是個人玩玩,像自媒體那些說的什么2小時搭一個知識庫+deepseek不要太香一類的RAG或者是基于知識庫的應用肯定是沒法用在企業級落地上的。
我們真的經歷過或者正在經歷的人都是知道的,怎么可能2小時就搭建完成一個知識庫,這能用嗎?
有時3周開發完,調試又3周,然后就陷入到了“茫茫無期”的各種幻覺的解決問題上了。
有時為了解決1個幻覺,又引發了另一個幻覺。
動不動調貓娘、到處核對數據、給數據打標、折了東墻補西墻,最終身心俱累,項目方也失去了信心。因此這個系列太重要了,筆者是匯聚了各種失敗案例、慘痛教訓于這一系列的課程中的。
通過上幾篇我們認識到了一種體系化解決、抑制幻覺的打法,即:3R理論,Rewrite->Retrieve->Read,這套理論不只是停留在表面上的“紙上談兵”,無論是業界還是我在教程中展示出的前后對比效果大家都意識到當使用3R理論去落地時,整體的幻覺幾乎被消除到零。這里面既包含了解決:過度擬合(