我是熊猫的新手,我有一个数据集,我想更改它的说明。
它有 40.000 行和 13 列,包含 2010 年 ('Último') 和 2009 年 ('PENÚLTIMO') 的财务信息
我感兴趣的部分是:'NOME'(公司名称),'GRUPO_DFP'(目前它只是资产负债表,但我打算添加更多),'ORDEM_EXER'(当前或去年,2010 年或 2009 年) , 'DS_CONTA'(资产类型),'VL_CONTA'(价值)
顺便说一句,这都是公开信息。
所以,删除我不想要的列,我得到这个:
问题从这里开始。
它像普通的 csv 一样显示信息:
ORDEM_EXER-----DS_CONTA-------------------------VL_CONTA
PENÚLTIMO-----Ativo Total-----------------------702571987.0
ÚLTIMO--------Ativo Total-----------------------802819794.0
PENÚLTIMO-----Caixa e Equivalentes de Caixa-----31037881.0
ÚLTIMO--------Caixa e Equivalentes de Caixa-----25219700.0
但我想要的是:
ÚLTIMO PENÚLTIMO
DS_CONTA
Ativo Total ----802819794.0--702571987.0
Caixa e Eq..----25219700.0---31037881.0
经过多次尝试,我得到了这个:
DF = DF.set_index(['NOME', 'GRUPO_DFP', 'DS_CONTA','ORDEM_EXER'], append=True)
DF.unstack()
不过,这不是我想要的。试图跳过第一行并只是取消堆叠,返回错误:
ValueError:索引包含重复条目,无法重塑
所以,我真的不知道我能做什么。
有只小跳蛙
拉莫斯之舞
侃侃无极
慕桂英546537
相关分类