我有一个包含文本的列(文本行)的数据框 df
df['textline'].iloc[0] = 'This is a test with 2018\n'
df['textline'].iloc[1] = 'This is a test with Jan 2018\n'
df['textline'].iloc[2] = 'This is a test with Feb 2018\n'
我想使用 Regex extractall 来遍历整个 df['textline'] 但它只会在没有前面的月份名称时提取年份。例如,在上面的示例中,它将从第一行中提取 2018,但不会从第二行或第三行中提取 2018,因为它具有 Jan 或 Feb(或其他月份)。
df['textline'].str.extractall(r'<<Regex code>>')
慕雪6442864
翻阅古今
相关分类