更新新列中的值

我想运行一个包(RAKE)从评论中提取关键短语(df['CUSTOMER_RECOMMENDATIONS_TRANS])并创建一个新列(df['keyphrase_RAKE'])来存储它们对应于每个评论。我收到一条错误消息,提示“ValueError:值的长度与索引的长度不匹配”。我知道错误背后的原因,但不知道如何解决。可以做什么?


关键字返回关键短语列表。


这是代码:

import RAKE

import operator


# Reka setup with stopword directory

stop_dir = "SmartStoplist.txt"

rake_object = RAKE.Rake(stop_dir)


# Sample text to test RAKE

df = pd.read_excel('my.xlsx')


for i in df['CUSTOMER_RECOMMENDATIONS_TRANS']:

    keywords = rake_object.run(i)

    df['keyphrase_RAKE'] = keywords


烙印99
浏览 99回答 1
1回答

慕虎7371278

您可以使用pandas.DataFrame.apply并避免 for 循环df['keyphrase_RAKE'] = df['CUSTOMER_RECOMMENDATIONS_TRANS'].apply(rake_object.run)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python