搜索
您的当前位置:首页正文

Elasticsearch 安装IK中文分词器并设置索引

来源:二三娱乐

本人的 Elasticsearch 版本是 6.2.3

下载并安装插件

./bin/elasticsearch-plugin install 
# sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install http://localhost:8000/elasticsearch-analysis-ik-6.2.3.zip -v

插件安装在 /usr/share/elasticsearch/plugins/
插件的配置文件在 /etc/elasticsearch/analysis-ik
测试下 sudo ./bin/elasticsearch-plugin list

注意文件的权限

当然也可以自己编译

安装java Maven

sudo apt-get install maven

编译 elasticsearch-ik


git checkout v6.2.3
mvn package

重启 elasticsearch

service elasticsearch restart

设置中文索引

curl -X PUT http://localhost:9200/weibo #新建一个index

curl -XPUT http://localhost:9200/weibo/_mapping/news -H 'Content-Type: application/json' -d'
{
  "properties": {
    "summary": {
      "type": "text",
      "analyzer": "ik_smart"
    },
    "title": {
      "type": "text",
      "analyzer": "ik_smart"
    }
  }
}'

ik_max_word: 会将文本做最细粒度的拆分,比如会将 "中华人民共和国国歌"拆分为
"中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌",会穷尽各种可能的组合
ik_smart: 会做最粗粒度的拆分, 比如会将 "中华人民共和国国歌"拆分为 "中华人民共和国,国歌" .


参考:

Top