数据结构:
HEIGHT Category
51 1
45 1
89 2
目标:计算几何平均值
import pandas as pd
import numpy as np
df = pd.read_csv('BaseFish',delimiter=',')
df.dropna(axis = 0)
df = df[df.HEIGHT != 0]
table = pd.pivot_table(df,values = 'HEIGHT',index = 'Category',aggfunc=(np.prod,np.count_nonzero))
table.insert(2,'GMEAN',0)
table['GMEAN']=table['prod']**(1/table['count_nonzero'])
问题:具有大量数据点的类别会产生 np.prod = infinity。因此最终的 GMEAN 也是无穷大。
我的 Python 知识非常基础,也是我使用它的唯一原因,因为数据点的数量超过了 excels 限制。
相关分类