進入 ES 的安裝目錄,進入 /elasticsearch-8.10.0/plugins/ik/config/ 文件夾目錄,打開 IKAnalyzer.cfg.xml 文件進行配置。
一、添加 自定義擴展詞典
- 擴展詞:就是不想哪些詞分開,讓他們成為一個詞,比如“蒙的全是對的”
- 例如
進入 /elasticsearch-8.10.0/plugins/ik/config/ 文件夾目錄, vim custom_word.dic,添加 蒙的全是對的
-
修改配置文件
-
然后重啟 ES
二、添加 自定義 停用詞擴展詞典
-
停用詞:有些詞在文本中對語義產生不了影響。例如英文的a、 an等。或中文的”的、了等”。這樣的詞稱為停用詞。停用詞經常被過濾掉,不會被進行索引。在檢索的過程中,如果用戶的查詢詞中含有停用詞,系統會自動過濾掉。停用詞可以加快索引的速度,減少索引庫文件的大小。
-
例如
進入 /elasticsearch-8.10.0/plugins/ik/config/ 文件夾目錄, vim custom_stopword.dic,添加 heiheihei
-
修改配置文件
-
然后重啟 ES
三、添加 自定義 同義詞(近義詞)詞典
-
同義詞:意思相同的,“番茄”和“西紅柿”,查詢“番茄”的時候,把帶有“西紅柿”的數據一起查出來,這種叫做同義詞查詢
-
例如
進入 /elasticsearch-8.10.0/plugins/ik/config/ 文件夾目錄, vim synonym.txt,添加
兒童,青年,少年,幼年
西紅柿,番茄 => 西紅柿,番茄
社保,公積金 => 社保,公積金
- 然后重啟 ES