我正在尝试计算数据框“文本”列中主题标签词的频率。
index text
1 ello ello ello ello #hello #ello
2 red green blue black #colours
3 Season greetings #hello #goodbye
4 morning #goodMorning #hello
5 my favourite animal #dog
word_freq = df.text.str.split(expand=True).stack().value_counts()
上面的代码将对文本列中的所有字符串执行频率计数,但我只是返回标签频率。
例如,在我上面的数据框上运行代码后,它应该返回
#hello 3
#goodbye 1
#goodMorning 1
#ello 1
#colours 1
#dog 1
有没有一种方法可以稍微重新调整我的 word_freq 代码,以便它只计算标签词并按照我上面的方式返回它们?提前致谢。
慕妹3146593
aluckdog
守候你守候我
相关分类