我正在处理一个具有价格列的大型数据集(超过200万行x 10列)。这些值的格式包括一千点分隔符(例如 1.000),并且还使用点来分隔小数(例如 3.000.75 而不是 3000,75)。
我想将列的格式设置为 float,但值中的 2 个点让我头疼。
通常,为了简单起见,假设没有超过1.000.000的数字,我会做这样的事情
for i in range (0,len(df)):
cell=str(df.iloc[i]['price'])
if cell.count(".")==2:
cell=cell.split(".")[0] + cell.split(".")[1] + '.' + cell.split(".")[2]
然后,是的,将列的格式设置为浮点数。
但我知道这远非最优(循环)。for
我怎样才能利用熊猫的力量来避免这里?for
谢谢!
森栏
喵喵时光机
白衣非少年
胡子哥哥
随时随地看视频慕课网APP
相关分类