我对python和pandas仍然很陌生,目前正在尝试在CSV文件中获取多个列的总和。
我有一个CSV文件,其中包含要求和的列,, :unitCountorderCountinvoiceCount
date id name unitCount orderCount invoiceCount
2020-02-12 1 Guitar 200 100 200
2020-02-12 2 Drums 300 200 100
2020-02-12 3 Piano 400 700 300
2020-02-11 1 Guitar 100 500 300
2020-02-11 2 Drums 200 400 400
2020-02-11 3 Piano 300 300 100
我想要的输出将是一个CSV文件,其中包含最后3列的总和(分组为),并且仅链接到最晚的日期:ID
date id name total_unitCount total_orderCount total_invoiceCount
2020-02-12 1 Guitar 300 600 500
2020-02-12 2 Drums 500 600 500
2020-02-12 3 Piano 700 1000 400
有人能帮忙吗?
到目前为止,我正在尝试以下方法,但它对我不起作用。是否可以添加到以下代码的第一行?还是我一开始就完全错了?谢谢!groupby
df = pd.read_csv(r'path/to/myfile.csv', sep=';').sum()
df.to_csv(r'path/to/myfile_sum.csv')
慕雪6442864
Helenr
浮云间
相关分类