熊猫:如何总结大小不等的数据集?

假设我有不同大小的数据集,例如X_1 = [1,2,3]X_2 = [4,5,6,7,8]。我想创建一个包含汇总变量(平均值、标准差等)的数据框,每行一个数据集,每列一个统计数据。我怎么能在熊猫中做到这一点?


繁华开满天机
浏览 178回答 2
2回答

斯蒂芬大帝

我会用 describedf=pd.concat([pd.Series(x) for x in [X_1, X_2]], axis=0, keys=['X_1', 'X_2'])# notice here I am using axis=0 rather than 1 df.groupby(level=0).describe()Out[442]:      count  mean       std  min  25%  50%  75%  maxX_1    3.0   2.0  1.000000  1.0  1.5  2.0  2.5  3.0X_2    5.0   6.0  1.581139  4.0  5.0  6.0  7.0  8.0特别案例X_1 = [1,2,np.nan] X_2 = [4,5,6,7,8]df=pd.concat([pd.Series(x) for x in [X_1, X_2]], axis=0, keys=['X_1', 'X_2'])df.groupby(level=0).size()Out[445]: X_1    3X_2    5dtype: int64
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python