如何提取与 CoreEntityMention匹配的维基百科实体

我正在对一些文本运行 CoreNLP,并将找到的实体与维基百科实体进行匹配。我想重建为找到的实体提供链接和其他有用信息的句子。


CoreEntityMention 有一个entity()方法,但它只返回一个字符串。


Properties props = new Properties();

props.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner,entitylink");


// set up pipeline

pipeline = new StanfordCoreNLP(props);

String doc = "text goes here";

pipeline.annotate(doc);


// Iterate the sentences

for (CoreSentence sentence : doc.sentences()) {

      Go through all mentions

      for (CoreEntityMention em : sentence.entityMentions()) {

          System.out.println(em.sentence());

          // Here I would like to extract the Wikipedia entity information

          System.out.println(em.entity());

      }

    }


萧十郎
浏览 84回答 1
1回答

蝴蝶不菲

您只需要添加维基百科页面 url。所以Neil_Armstrong映射到https://en.wikipedia.org/wiki/Neil_Armstrong.
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java