我使用pandas作为数据库替代品,因为我有多个数据库(oracle,mssql等),并且无法对SQL等效命令进行一系列命令。
我在DataFrame中加载了一个带有一些列的表:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
在SQL中,每年计算不同客户端的数量将是:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
结果将是
201301 5000
201302 13245
如何在熊猫中做到这一点?
阿晨1998
牧羊人nacy
江户川乱折腾
相关分类