我在 dask groupby 上工作,我在这里面临一些问题
我已经定义了我的custom_max,它在没有dask的情况下工作得很好。
import dask.dataframe as dd
from something import custom_max
df.head()
Date Time productID some_id some_name ...
133192 26/10/2015 22:50:57 16037492655230761375561 12345 rahul ...
133186 26/10/2015 22:50:48 16037492655330761377104 12345 rahul ...
27323 26/10/2015 22:50:36 16037483834140761373004 3456 rajesh ...
27322 26/10/2014 22:50:33 16037483834150761373390 3564 suresh ...
133191 26/10/2014 22:50:33 16037492655330761377107 3456 rajesh ...
new_grouped = dd.from_pandas(df, npartitions=10).groupby(["some_id"])
new_grouped
agg_meta =
{'some_name': NamedAgg(column='some_name', aggfunc=<function custom_max at 0x7fe6f5c16e18>)}
<dask.dataframe.groupby.DataFrameGroupBy object at 0x7fe6f5441978>
agg_df = new_grouped.agg(**agg_meta).compute()
TypeError: agg() got an unexpected keyword argument 'some_name'
任何人都可以指导我我犯了什么错误吗?
我正在使用 pandas 0.25.3 和 dask 2.9.0
提前致谢
慕婉清6462132
相关分类