创建一个新的数据框,计算每个用户的正面和负面推文

我有以下数据框:

http://img3.mukewang.com/62986dad000156f610740710.jpg

它包含 user_ids、推文、位置以及推文的分类为负面和正面。

我想创建一个按用户 ID 分组的新数据框,因为每个用户在数据框中都有多个推文。数据框应包含以下列:

  1. 用户身份

  2. 该 user_id 的负面推文计数

  3. 该 user_id 的正面推文计数

  4. 用户的位置

所需样本输出

user_id             positive_tweets   negative_tweets    Location

418                 1                    0                   CA

521                 1                    0                   CA

997                 0                    1                   LA

1135                1                    0                   LA

此代码是 BlackFox 先生针对我之前未正确询问的问题提出的。


df.groupby(['user_id','classification'])['user_id'].count()

但是,它与所需的输出不匹配。


慕姐4208626
浏览 124回答 1
1回答

暮色呼如

我希望这就是你要找的。df.groupby(['user_id', 'Location']).apply(lambda x: pd.Series(dict(positive_tweets=(x.classification == 'positive').sum(),negative_tweets=(x.classification == 'negative').sum(),)))
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python