有一个大的DataFrame如下:
userid user_mentions
1 [2, 3, 4]
1 [3]
2 NaN
2 [1,3]
3 [1,4,5]
3 [4]
该user_mentions栏目是名单userid已经由每一个用户提到秒。例如,第一行的意思是:
用户 1 提到了用户 2、3 和 4。
我需要在userid列中的用户之间创建一个提及网络。也就是说,我想要userid列中每个用户被列中其他用户提及的次数userid。所以基本上,首先我需要这样的东西:
filtered = df[df['user_mentions'].isin(df['userid'].unique())]
但这对一列列表不起作用。
如果我解决了上述问题,那么我可以groupby['userid','user_mentions']。
编辑
最终输出应该是:
Source Target Number
1 2 1
1 3 2
2 1 1
2 3 1
3 1 1
3 5 1
皈依舞
慕斯709654
海绵宝宝撒
相关分类