已解决,两个结果是运行两次LDA模型得到的,而因为没有设置随机数种子,所以每次模型得到的结果是不同的
特意的,要清空一下保留空间呀
词语太多,向量是稀疏的
30w的都大同小异,自己都能退出来的吧,好好上课
https://github.com/bainingchao/PyDataPreprocessing/blob/master/Chapter7/similar.py
我也找了好久 分享给你哦 https://bainingchao.github.io/2018/10/10/%E7%BC%96%E7%A8%8B%E6%95%B0%E5%AD%A6%E4%B9%8B%E8%B7%9D%E7%A6%BB%E8%AE%A1%E7%AE%97/
payititi:国内的一个人工智能数据及服务平台,为开发者和开发团队提供数据集查询和下载。
https://www.payititi.com