我有一个带有 ids 作为字符串的 Pandas 数据框 df:我正在尝试创建 new_claim 和 new_description 列
我发现的最接近的 SO 是使用正则表达式有效地将一列中的部分值替换为熊猫中另一列中的值?但这使用了拆分部分,并且由于描述发生了变化,我无法一概而论。
我可以跑一次
date_reg = re.compile(r'\b'+df['old_id'][1]+r'\b')
df['new_claim'] = df['claim'].replace(to_replace=date_reg, value=df['external_id'], inplace=False)
但如果我有
date_reg = re.compile(r'\b'+df['claim']+r'\b')
然后我得到“TypeError: 'Series' 对象是可变的,因此它们不能被散列”
我采取的另一种方法
df['new_claim'] = df['claim']
for i in range(5):
old_id = df['old_id'][i]
new_id = df['external_id'][i]
df['new_claim'][i] = df['claim'][i].replace(to_replace=old_id,value=new_id)
这给出了一个类型错误:replace() 没有关键字参数
一只名叫tom的猫
相关分类