ES分词器
分词器
内置分词器
es分词器类型:(可下载第三方插件分词器,有对中文更好的支持)
ES中文分词器
standard:ES默认,将词汇单元转换为小写形式,并且去除停用词、标点符号,支持中文(单字切分)。
simple:通过非字母字符来分割文本信息,然后将词汇单元统一转换为小写形式,会去除掉数字类型的字符。
whitespace:仅仅是去除空格、小写,不支持中文,对分割的词汇单元不做标准化的处理。
language:特定语言的分词器,不支持中文。