猿问

如何使用 Lucene 将小写字母应用于字符串

我开始使用阿帕奇卢塞尼8.0。我想知道如何使用Lucene将我的变量转换为小写字母。我不太确定如何做到这一点,因为我找不到任何例子。我想要的是这样的东西:String text


public class DocumentLowercase {


private Analyzer analyzer; 


public Analyzer DocAnalysis(Document d) {


    analyzer = new StandardAnalyzer();

    String text = d.text();


    **Here convert String Text into lowercase**

    ** maybe using Lower Case Tokenizer? but how? **        


    return analyzer;



}

}


LEATH
浏览 122回答 1
1回答

浮云间

标准分析仪已经将所有内容转换为小写字母!在此处查看文档:http://lucene.apache.org/core/8_0_0/core/org/apache/lucene/analysis/standard/StandardAnalyzer.html他们说:使用可配置的非索引字列表,使用小写筛选器和停止筛选器筛选标准增强程序。您还可以在源代码中看到标准分析器包含哪些组件:  @Override  protected TokenStreamComponents createComponents(final String fieldName) {    final StandardTokenizer src = new StandardTokenizer();    src.setMaxTokenLength(maxTokenLength);    TokenStream tok = new LowerCaseFilter(src);    tok = new StopFilter(tok, stopwords);    return new TokenStreamComponents(r -> {      src.setMaxTokenLength(StandardAnalyzer.this.maxTokenLength);      src.setReader(r);    }, tok);  }如果您无论如何都要自定义分析器,则应查看 。CustomAnalyzer
随时随地看视频慕课网APP

相关分类

Java
我要回答