如何使用不同列 [2] 中的字符串值列表替换数据框列 [1] 中的字符串值。
数据
0 1 2 3
0 3000 20% dummy1 3000 dummy2 20% [3000, 20%] dummy1 dummy2
我想使用第 2 列中的列表(即“[3000, 20%]”)替换第 1 列中的字符串值,即“dummy1 3000 dummy2 20%”。所以 3000 和 20% 被替换为字符串中的“”(空字符串)以形成第三列(结果)即“dummy1 dummy2”
代码
df = pd.DataFrame([['3000 20%', 'dummy1 3000 dummy2 20%']])
df[2] = df[0].str.split(' ')
def replace_string(x):
repl_string = str(x[1])
for key in x[2]:
repl_string = repl_string.replace(key, '')
return ' '.join(repl_string.split())
df[3] = df.apply(replace_string, axis=1)
我目前已经编写了上面的代码,这对于大型数据帧来说很慢。如何提高此代码的效率或有其他方法可以做到这一点?
素胚勾勒不出你
相关分类