根据Gensim 在 WordEmbeddingKeyedVectors 上的页面,您可以逐步添加新词向量的新键值对。但是,在使用预训练的向量及其标签初始化 WordEmbeddingKeyedVectors,并向其添加新的看不见的模型推断词向量后,该most_similar方法无法再使用。
from gensim.models.keyedvectors import WordEmbeddingsKeyedVectors
test = WordEmbeddingsKeyedVectors(vector_size=3)
test.add(entities=["1", "2"], weights=[np.random.randint(5, size=3),
np.random.randint(5, size=3)])
test.most_similar("2") #THIS WORKS
test.add(entities=['3'], weights=[np.random.randint(5, size=3)])
test.most_similar("3") #THIS FAILS
我希望输出是与输入标签最相似的矢量标签列表,但输出是:
IndexError:索引 2 超出轴 0 的范围,大小为 2
人到中年有点甜
手掌心
相关分类