我对 Python 很陌生,我正在尝试清理一些数据。我附上了数据文件的链接(两个选项卡:原始数据和所需的结果)。请帮忙!
我正在尝试做的事情:
删除第 1-23 行
使用“-”作为分隔符将 B 列拆分为多列
将列名分配给新列
保留数字列
原始数据(第一个标签)和预期结果(第二个标签)的链接: https : //www.dropbox.com/s/kjgtwoelq21eetw/Example2.xlsx?dl=0
我目前拥有的:
import numpy as np
data_xls=pd.read_excel("Example2.xlsx", index_col=None).fillna('')
data_xls = data_xls.iloc[22:]
data_xls.rename(columns=data_xls.iloc[0]).drop(data_xls.index[0])
data_xls['Internal Link Tracking (non-promotions) - ENT (c20)'].str.split('-', expand=True)
writer = pd.ExcelWriter('Output2.xlsx')
data_xls.to_excel(writer, 'O1', index=False)
writer.save()
相关分类