Java 文章相似度算法

新闻数据量大,数据实时在网上抓取,有时候一天几万条数据入库!这种大数据量的情况下如何实现计算每篇文章跟剩余文章的相似度?就是怎么去做的一篇文章跟他相似度很的文章?求大神指教下!

抱着枕头睡
浏览 1191回答 1
1回答

pardon110

提取特征码,关键词等 后比较
打开App,查看更多内容
随时随地看视频慕课网APP