因此,在我的数据帧中,我有一列“Actors”,其中包含演员的多个“first_name姓氏”。
例如:“丹尼斯·克里斯托弗,丹尼斯·奎德,丹尼尔·斯特恩”作为类型“类别”
当我使用它时,会将上述组稀疏为6个单词。我希望该函数不考虑名称之间的''(空格),而只考虑'',因此在前面的示例中,它将稀疏为3个单词。CountVectorizer().fit_transform(df['Actors'])
vectorizer = CountVectorizer() Actors_f = vectorizer.fit_transform(df.loc[df['Actors'].notna(), 'Actors'])
有没有办法做到这一点?
FFIVE
qq_遁去的一_1
白衣非少年
qq_花开花谢_0
相关分类