假设我已经使用50000个文档训练了doc2vec模型,并且我想为包含36000个文档的单独数据集推断向量。在这种情况下,推断的向量对于下游的分类任务是否有效,因为我的假设是推断的向量取决于训练模型的文档的大小。
注意:两个数据集,即用于训练doc2vec的数据集和另一个用于推断向量的数据集都是唯一的,但来自美国最高法院的同一领域。
如果我有正当理由错了,请纠正我。
守着星空守着你
相关分类