我正在尝试获取百分比表格数据,其中我尝试使用 pandas 的交叉表函数,但每列的行明智总和不正确(我用 Excel 总和检查了这一点)。基本上,在我的进出口贸易数据中,我试图获得每个国家的时期百分比。
表格数据:
这是关于公共要点的表格数据,我想按时期获得每个国家/地区的百分比。
为了获得按列计算的总和,我这样做了:
import pandas as pd
df=pd.read_csv('minimal_data.csv', encoding='utf-8')
df.loc[:,'Total'] = df.sum(axis=1)
但是这个总和和做excel sum的方式不一样。我不知道为什么。
然后我尝试以下获取百分比表格数据:
pd.crosstab(index=df.index,
columns=df.columns,
values=df.columns.value,
aggfunc='sum',
normalize='index').applymap('{:.2f}%'.format)
我期待表格数据的百分比,其中每个国家按时期的百分比。我不知道为什么,在我的尝试中,我没有得到正确的总和和预期百分比表。谁能指出我?有什么快速的解决方案可以完成这项工作吗?
我认为 usingcrosstab就在这里,但我没有通过保持相同的行和列名称约定得到正确的百分比表。任何想法使这项工作?
叮当猫咪
青春有我
慕娘9325324
随时随地看视频慕课网APP
相关分类