猿问
如何计算两个文本文档之间的相似度?
如何计算两个文本文档之间的相似度?
我正在寻找一个NLP项目,使用任何编程语言(虽然Python将是我的偏好)。
我想拿两份文件,确定它们有多相似。
largeQ
浏览 1335
回答 3
3回答
茅侃侃
这是一个老问题,但我发现这可以通过Spacy轻松完成。一旦读取文档,similarity就可以使用简单的api 来找到文档向量之间的余弦相似度。import spacynlp = spacy.load('en')doc1 = nlp(u'Hello hi there!')doc2 = nlp(u'Hello hi there!')doc3 = nlp(u'Hey whatsup?')print doc1.similarity(doc2) # 0.999999954642print doc2.similarity(doc3) # 0.699032527716print doc1.similarity(doc3) # 0.699032527716
0
0
0
随时随地看视频
慕课网APP
相关分类
源码
spark分组排序提取前N个值
1 回答
请问转让门店小程序需要源码吗?门店小程序有自己的源代码吗?是否要注册计算机软件著作权才可以交易?
1 回答
算法与数据结构
数据结构中,与所使用的计算机无关的数据是什么?
1 回答
学完C语言之后是先学数据结构还是先学JAVA好呢?
1 回答
我要回答