elasticsearch8.12.0安裝分詞

上篇說到,安裝了es后正常運行

es分詞下載地址

從 GitHub Release 下載(推薦)
👉 https://github.com/medcl/elasticsearch-analysis-ik/releases

https://release.infinilabs.com/analysis-ik/stable/

安裝:

選擇與你 ES 版本匹配的包,例如:

elasticsearch-analysis-ik-8.12.0.zip

下載命令:

cd /tmp
wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.12.0/elasticsearch-analysis-ik-8.12.0.zip

?? 注意:不要下載 source code,要下載 assets 里的 .zip 文件。


3. 創建 plugins 目錄(如果不存在)

Elasticsearch 插件默認安裝在:

$ES_HOME/plugins/ik/

創建目錄:

mkdir -p $ES_HOME/plugins/ik

4. 解壓插件到 plugins 目錄

unzip elasticsearch-analysis-ik-8.12.0.zip -d $ES_HOME/plugins/ik/

$ES_HOME 是你的 Elasticsearch 安裝目錄,例如 /data/isee/apps/elasticsearch-8.12.0


5. 檢查目錄結構

安裝完成后,目錄結構應如下:

$ES_HOME/plugins/ik/
├── plugin-descriptor.properties
├── plugin-security.policy
├── config/
│   ├── IKAnalyzer.cfg.xml
│   ├── main.dic
│   └── stopword.dic
└── lib/├── elasticsearch-analysis-ik-8.12.0.jar└── commons-codec-1.9.jar└── ...

6. 修改配置文件(可選)

配置文件路徑:

$ES_HOME/plugins/ik/config/IKAnalyzer.cfg.xml

你可以添加自定義詞典:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties><comment>IK Analyzer 擴展配置</comment><entry key="ext_dict">custom.dic</entry><entry key="ext_stopwords">stopwords.dic</entry>
</properties>

然后在 config/ 目錄下創建 custom.dic,添加自定義詞匯:

人工智能
大模型
阿里云
Qwen

7. 設置權限(重要)

確保 Elasticsearch 用戶有權限讀取插件:

chown -R isee:isee $ES_HOME/plugins/ik
# 或你運行 ES 的用戶

8. 重啟 Elasticsearch

# 先停止
ps aux | grep elasticsearch
kill <pid># 啟動
bin/elasticsearch -d

? 三、驗證插件是否安裝成功

1. 檢查日志

查看 $ES_HOME/logs/isee_cluster.log,確認沒有插件加載錯誤。

2. 調用分詞 API 測試

# curl -X GET  -u elastic:9yZWp=3UnEVkBxYBhnlS "https://10.10.10.10:9200/_analyze" -H "Content-Type: application/json" -d'
> {
>   "analyzer": "ik_smart",
>   "text": "阿里巴巴推出通義千問大模型"
> }'
curl: (60) Peer's certificate issuer has been marked as not trusted by the user.
More details here: http://curl.haxx.se/docs/sslcerts.htmlcurl performs SSL certificate verification by default, using a "bundle"of Certificate Authority (CA) public keys (CA certs). If the defaultbundle file isn't adequate, you can specify an alternate fileusing the --cacert option.
If this HTTPS server uses a certificate signed by a CA represented inthe bundle, the certificate verification probably failed due to aproblem with the certificate (it might be expired, or the name mightnot match the domain name in the URL).
If you'd like to turn off curl's verification of the certificate, usethe -k (or --insecure) option.

才想起來,我們是https的服務,有ca證書,先不認證證書,-k

# curl -k -X GET  -u elastic:9yZWp=3UnEVkBxYBhnlS "https://10.10.10.10:9200/_analyze" -H "Content-Type: application/json" -d'
> {
>   "analyzer": "ik_smart",
>   "text": "阿里巴巴推出通義千問大模型"
> }'
{"tokens":[{"token":"阿里巴巴","start_offset":0,"end_offset":4,"type":"CN_WORD","position":0},{"token":"推出","start_offset":4,"end_offset":6,"type":"CN_WORD","position":1},{"token":"通義","start_offset":6,"end_offset":8,"type":"CN_WORD","position":2},{"token":"千","start_offset":8,"end_offset":9,"type":"TYPE_CNUM","position":3},{"token":"問","start_offset":9,"end_offset":10,"type":"CN_CHAR","position":4},{"token":"大模型","start_offset":10,"end_offset":13,"type":"CN_WORD","position":5}]}[isee@host-10-15-32-71 elasticsearch-8.12.0]$ 

分詞安裝成功。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/93964.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/93964.shtml
英文地址,請注明出處:http://en.pswp.cn/web/93964.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

強化學習算法分類與介紹(含權重更新公式)

強化學習算法種類豐富&#xff0c;可按學習目標&#xff08;基于價值 / 基于策略 / 演員 - 評論家&#xff09;、數據使用方式&#xff08;在線 / 離線&#xff09;、是否依賴環境模型&#xff08;無模型 / 有模型&#xff09;等維度分類。以下按核心邏輯梳理常見算法&#xff…

基于STM32F103單片機智能門禁熱釋人體感應報警設計

1 系統功能介紹 本設計基于 STM32F103C8T6 單片機&#xff0c;通過多種傳感器、執行器以及通信模塊實現智能門禁和安防報警功能。其主要功能是檢測門外人員情況&#xff0c;結合環境光照強度判斷是否需要照明&#xff0c;同時結合 GSM 模塊在異常情況下發送報警信息&#xff0c…

imx6ull-驅動開發篇33——platform 平臺驅動模型

目錄 Linux 驅動的分離與分層 驅動的分隔與分離 驅動的分層 platform 平臺驅動模型 platform 總線 bus_type 結構體 platform 總線 platform_match函數 platform 驅動 platform_driver 結構體 device_driver 結構體 platform_driver_register 函數 platform_drive…

Win/Linux筆記本合蓋不睡眠設置指南

在 筆記本電腦上&#xff0c;當你合上屏幕時&#xff0c;默認系統可能會進入“睡眠”或“休眠”狀態。如果你希望合上屏幕時系統繼續正常運行&#xff08;例如后臺下載、運行程序、遠程訪問等&#xff09;&#xff0c;需要修改系統的電源設置。 一、以下是 Windows 10 / Windo…

(棧)Leetcode155最小棧+739每日溫度

739. 每日溫度 - 力扣&#xff08;LeetCode&#xff09; while要把stack的判斷放在前面&#xff0c;否則stack[-1]可能報錯 class Solution(object):def dailyTemperatures(self, temperatures):""":type temperatures: List[int]:rtype: List[int]""…

【NLP(01)】NLP(自然語言處理)基礎

目錄NLP基礎一、基本概念1. 自然語言處理的基本介紹1.1 與語言相關的概念1.2 為什么使用NLP2. NLP的應用方向2.1 **自然語言理解**2.2 自然語言轉換2.3 自然語言生成3. NLP基礎概念4. NLP的發展歷史5. NLP的基本流程二、NLP中的特征工程0. 引入1. 詞向量2. 傳統NLP中的特征工程…

Python工程師進階學習道路分析

本文將分為以下幾個核心部分&#xff1a; 心態與基礎重塑&#xff1a;從“會用”到“精通”核心語言深度&#xff1a;窺探Python的奧秘編程范式與設計模式&#xff1a;寫出優雅的代碼并發與異步編程&#xff1a;釋放多核時代的威力性能分析與優化&#xff1a;讓代碼飛起來深入…

IntelliJ IDEA中Maven的“Sync“與“Reload“詳解:小白的避坑指南

在IntelliJ IDEA中使用Maven時&#xff0c;Sync All Maven Projects&#xff08;同步&#xff09;和 Reload All Maven Projects&#xff08;重新加載&#xff09;是兩個最常用的操作按鈕。它們看似相似&#xff0c;實則承擔著完全不同的職責。本文將通過通俗易懂的對比和場景分…

網絡地址的詳細計算說明

IP地址分類與計算 IP地址分5類A類 &#xff1a;0開頭&#xff0c;適用于大型網絡 B類 &#xff1a;10開頭&#xff0c;適用于中型網絡 C類 &#xff1a;110開頭&#xff0c;適用于小型網絡 D類 &#xff1a;1110開頭&#xff0c;用于組播 E類 &#xff1a; 1110開頭&#xff0c…

人工智能驅動的現代電商前端開發:從基礎到智能體驗

引言&#xff1a;AI如何重塑電商體驗電子商務行業正在經歷一場人工智能革命。從個性化推薦到視覺搜索&#xff0c;從智能客服到預測分析&#xff0c;AI技術正在徹底改變用戶與電商平臺的交互方式。作為前端開發者&#xff0c;了解如何集成AI功能已成為必備技能。本文將帶您深入…

mimic數據統計

是否能聯通 psql -h 127.0.0.1 -U Shinelon-d mimic --password pgadmin建庫 psql -d mimiciv -f mimic-iv/buildmimic/postgres/create.sql 也可以pgadmin直接運行create.sql 導入csv.gz數據 psql -d mimic -v ON_ERROR_STOP1 -v mimic_data_dirH:/mimic-iv-2.2 -f C:\Users\S…

孟德爾隨機化小試 從軟件安裝數據下載到多種檢驗

孟德爾隨機化&#xff08;Mendelian Randomization, MR&#xff09;作為一種利用基因數據推斷因果關系的強大工具&#xff0c;在流行病學研究中應用廣泛。本文將詳細講解MR的核心原理、完整分析流程&#xff0c;并附上關鍵代碼實現&#xff0c;幫助你從零開始完成一次MR分析。1…

記一次:postman請求下載文件的使用方法

前言&#xff1a;筆者的后端接口是swagger&#xff0c;遇到像文件導出下載的功能就實現不了。然后使用postman工具就可以了。注&#xff1a;postman工具使用send下拉選項中有請求下載&#xff0c;如圖完美解決。后續有其它方法在補充。

快速搭建項目(若依)

RuoYi-Vue 是一個 Java EE 企業級快速開發平臺&#xff0c;低代碼的框架。 1.環境要求&#xff1a; 其中MySQL和Redis放在服務器上或者本機上。 2.代碼搭建&#xff1a; 代碼下載地址&#xff1a;https://gitee.com/y_project/RuoYi-Vue&#xff0c;在官方文檔里面可下載若依…

iOS開發之UICollectionView為什么需要配合UICollectionViewFlowLayout使用

1. UICollectionView 的職責分離UICollectionView 本質上只是一個容器&#xff0c;用來展示一系列的 cell&#xff08;單元格&#xff09;。 它本身 不關心 cell 的擺放方式&#xff0c;只負責&#xff1a;Cell 的復用&#xff08;避免性能浪費&#xff09;Cell 的增刪改查滾動…

一、部署LNMP

一、準備環境操作系統&#xff1a;CentOS 7.x&#xff08;最少 2 核 CPU 2GB 內存 20GB 磁盤&#xff09;網絡&#xff1a;能訪問公網&#xff08;用于下載包&#xff09;軟件版本&#xff1a;Nginx 1.20MySQL 5.7/8.0PHP 7.4WordPress 6.x&#xff08;商城插件 WooCommerce&…

【時時三省】vectorCAST 便捷使用技巧

山不在高,有仙則名。水不在深,有龍則靈。 ----CSDN 時時三省 目錄 1,工程的共享 2,工程的關鍵文件保存 2,工作環境目錄下,各個文件夾的作用 1,build 和 environment 的區別 2,vcm的作用 3,tst 文件的妙用 4,配置文件的妙用 5,復制測試環境 6,vectorCAST…

TOPSIS 優劣解距離法總結

TOPSIS 優劣解距離法總結 1. 基本思想 TOPSIS&#xff08;Technique for Order Preference by Similarity to Ideal Solution&#xff09;方法通過計算方案與正理想解&#xff08;最優值&#xff09;和負理想解&#xff08;最劣值&#xff09;的距離&#xff0c;來評價方案的優…

機器學習筆試題

人工智能與機器學習單選題&#xff08;50道&#xff09;1. 機器學習的核心目標是&#xff1a;A. 通過硬編碼規則解決問題 B. 從數據中自動學習模式 C. 提高計算機硬件性能 D. 優化數據庫查詢速度2. 以下屬于監督學習任務的是&#xff1a;A. 聚類分析 B. 圖像分類 C. 異常檢測 D…

CISP-PTE之路--10文

1.TCP/UDP 工作在 OSI 哪個層? 應用層 傳輸層 數據鏈路層 表示層 答案:傳輸層 解析:TCP(傳輸控制協議)和 UDP(用戶數據報協議)是 OSI 模型中傳輸層的核心協議,負責端到端的數據傳輸管理,如可靠性(TCP)、實時性(UDP)等。 2.下列哪種設備可以隔離 ARP 廣播幀? …