我已经使用朴素贝叶斯算法实现了 ML 模型,我想在其中实现增量学习。我面临的问题是当我训练我的模型时,它在预处理时生成 1500 个特征,然后在一个月后使用反馈机制,如果我想用可能包含一些新特征的新数据训练我的模型,可能少于或多于超过 1500(即我以前的数据集)如果我fit_transform用来获取新功能,那么我现有的功能集就会丢失。
我一直在使用部分拟合,但部分拟合的问题是您需要与以前模型相同数量的特征。我如何让它循序渐进地学习?
cv = CountVectorizer()
X = cv.fit_transform(corpus).toarray() #replaces my older feature set
classifier = GaussianNB()
classifier.partial_fit(X,y)
#does not fit because the size of feature set count is not equal to previous feature set count
一只名叫tom的猫
相关分类