基于其他列在数据框中标记文本和计数

我需要标记数据,但似乎真的很混乱。我有这样的数据:


TEXT               Author               Date

This is a Cat       Jane                 1.01.1997

This is a Dog       Sara                 1.02.2009

I have a cat        Lesner               5.07.2001

我需要这样的输出:


Date:

1.01.1997    This

1.01.1997    is

1.01.1997     a

1.01.1997    cat

.

.

.

.

有没有办法实现这样的输出?


UYOU
浏览 109回答 1
1回答

牛魔王的故事

Series.str.split在Series.explodepandas 0.25+ 中使用Series:s = df.set_index('Date')['TEXT'].str.split().explode()print (s)Date1.01.1997    This1.01.1997      is1.01.1997       a1.01.1997     Cat1.02.2009    This1.02.2009      is1.02.2009       a1.02.2009     Dog5.07.2001       I5.07.2001    have5.07.2001       a5.07.2001     catName: TEXT, dtype: object如果想要 2 列DataFrame添加Series.reset_index:df = s.reset_index(name='text')print (df)         Date  text0   1.01.1997  This1   1.01.1997    is2   1.01.1997     a3   1.01.1997   Cat4   1.02.2009  This5   1.02.2009    is6   1.02.2009     a7   1.02.2009   Dog8   5.07.2001     I9   5.07.2001  have10  5.07.2001     a11  5.07.2001   cat
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python