如何只考虑熊猫对象中元组的第一个元素

假设我的熊猫数据框的某些列中有元组元素,我想使用类似的方法 .describe() id 只考虑每个元组的第一个值例如我的数据框是:


   col1  col2  col3

0  6    (5,8)  (4,7)

1  5    (6,3)  (1,2)

2  8    (3,7)  (3,6)

当我使用这个方法时


df = pd.describe(df)

我希望它为每个带有元组的列采用元组的第一个值来计算平均值和其他统计数据


杨__羊羊
浏览 75回答 1
1回答

HUH函数

只需使用str访问器切片并分配回第一个元素:df.assign(**df[['col2','col3']].apply(lambda x: x.str[0])).describe()           col1      col2      col3count  3.000000  3.000000  3.000000mean   6.333333  4.666667  2.666667std    1.527525  1.527525  1.527525min    5.000000  3.000000  1.00000025%    5.500000  4.000000  2.00000050%    6.000000  5.000000  3.00000075%    7.000000  5.500000  3.500000max    8.000000  6.000000  4.000000在哪里:df.assign(**df[['col2','col3']].apply(lambda x: x.str[0]))   col1  col2  col30     6     5     41     5     6     12     8     3     3
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python