ElasticSearch如何做好中文分词(elasticsearch ngram分词器)

雍保姬
导读 大家好,小问来为大家解答以上问题。ElasticSearch如何做好中文分词,elasticsearch ngram分词器这个很多人还不知道,现在让我们一起来看看...

大家好,小问来为大家解答以上问题。ElasticSearch如何做好中文分词,elasticsearch ngram分词器这个很多人还不知道,现在让我们一起来看看吧!

1、 ElasticSearch提供了强大的搜索功能,而模糊搜索在关系数据库中具有不可替代的优势,而模糊搜索的关键是倒排索引的建立。不同的分词会导致ES创建不同的倒排索引,所以分词的选择很重要。

2、 中文和英文相比,中文的分词难度更大,因为不同的汉字可以随机组合成不同的词,有些词在特殊的句子中不能理解为一个词。比如北京仁和服装厂,仁和可以是一个字,和服可以是一个字。

3、 本文总结了一些关于如何做好中文分词的经验,希望对大家有所帮助。

4、 标准分词与IK分词的比较

以上就是【ElasticSearch如何做好中文分词,elasticsearch ngram分词器】相关内容。

标签:

免责声明:本文由用户上传,如有侵权请联系删除!