句子被标记为 pandas 中的单词,但索引从 0 到第一句的长度,第二句的索引从 0 开始

我有一个 python df,


     DF1 = Index  Words    Tags

             0      I       O

             1     Love     B

             2     India    I

             0    Flowers   B

             1      are     O

             2   Beautiful  B

我希望输出是


   DF1 = Index  Words    Tags   Sent

             0      I       O    1

             1     Love     B    1

             2     India    I    1

             0    Flowers   B    2

             1      are     O    2

             2   Beautiful  B    2

我想要一个df


潇潇雨雨
浏览 74回答 1
1回答

慕勒3428872

试试这个,pandas.DataFrame.Shift创建一个布尔掩码并应用pandas.Series.cumsum。df['Sent'] = (df.Index - df.Index.shift()).lt(0).cumsum() + 1   Index      Words Tags  Sent0      0          I    O     11      1       Love    B     12      2      India    I     13      0    Flowers    B     24      1        are    O     25      2  Beautiful    B     2
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python