我对 python 很陌生,需要帮助。我有一个从数据框中获得的关键字列表,如下所示: key_a_list = df_key_words['words'].tolist()
我有第二个数据框,它由语句组成:df_response['statement'] 我已经更正了拼写错误,对df_response['statement']列中的文本进行了标记和词干化。我需要检查;中是否有key_a_list匹配单词的单词 df_response['statement']然后我必须设置一个计数器来key_a_list计算df_response['statement'].
感谢您的时间和帮助,非常感谢:)
这是我拥有的当前代码,但它给了我一个错误: ValueError: Lengths must match to compare
count_a = 0
def count(x):
for x in key_a_list:
if key_a_list == df_response['statement']:
count_a = count_a + 1
return count_a
df_response['statement'] = df_response['statement'].apply(lambda x: " ".join([count(x) for word in x.split()]))
key_a_list 由以下词组成:['think'、'college'、'education'、'help'、'better'、'prepare'、'career'、'chosen'、'finally'、'enable'、'enter ','工作','市场','领域','喜欢','制作','选择','社交','方向','相信','附加','年份','改进', '能力','工人','证明','有能力','完成','学位','富有','成功','感觉','重要','展示','聪明','人'、'订单'、'薪水'、'以后'、'上'、'想要'、'该'、'好'、'生活'、'学习'、'高中”,“精算师”,“寻找”,“高薪”,“获得”,“声望”]
df_response['statement'] 如下所示:
statement
0 parent said
1 want make difference
2 dont know
3 rich
4 go career want
5 actuary
6 social life
7 expected society
df_response 的期望输出是:
statement count_a
0 parent said 0
1 want make difference 2
2 dont know 0
3 rich 1
4 go career want 2
5 actuary 1
6 social life 2
7 expected society 0
胡说叔叔
弑天下
jeck猫
随时随地看视频慕课网APP
相关分类