我有两个数据框
df1
name
ADAM, HAFIZ M
ABAD, FARLEY J
CORDDED, NANCY C
BOMBSHAD, WANG D
df2
JOSEPH W. HOLUBKA
WANG E. JONATHAN
CUCU F. LIU,
WANG C. DANA,
LANDY F. JON
我希望提取每个数据帧的名字。对于 df1,我需要“,”之后的“名字”部分,第二个 df,名字就是我想要的。
所以返回的 df 是
df1
HAFIZ
FARLEY
NANCY
WANG
df2
JOSEPH
WANG
CUCU
WANG
LANDY
我当前的代码是
df['name'].str.upper().apply(lambda name:re.search(r'\w+(?!.*,)',name).group())
这个正则表达式适用于两个 df,但是,我刚刚意识到我的数据有一个输入错误。在 df2 中,Liu 和 Dana 末尾有一个“,”,这导致正则表达式不起作用。
错误是 group() 不是属性。
无论如何我可以修复这个代码吗?正则表达式应该适用于 df
沧海一幻觉
牧羊人nacy