我有一个数据框,其中有一列包含一个以逗号分隔的项目的字符串。
col1
apple, banana, kiwi
apple, banana
banana
我想制作第二列“col2”来显示每一行之间的差异。
所以我试图将每一行变成一个集合,并从前一行中减去它,如下所示:Python comparing two strings to differences
df['col2'] = set(df["col1"].shift(1)) - set(df["col1"])
但是我收到此错误消息:“ValueError:值的长度与索引的长度不匹配”。我做错了什么,有没有更好的方法来做我正在做的事情?
编辑:预期输出
col1 col2
apple, banana, kiwi
apple, banana kiwi
banana apple
喵喔喔
相关分类