我有两个不同的文本,我想使用 tfidf 矢量化进行比较。我正在做的是:
标记每个文档
使用 TFIDFVectorizer.fit_transform(tokens_list) 进行矢量化
现在我在第 2 步之后得到的向量具有不同的形状。但根据概念,我们应该对两个向量具有相同的形状。只有这样才能比较向量。
我究竟做错了什么?请帮忙。
白猪掌柜的
相关分类