我有以下问题:我的目标是提取数据帧的唯一成员ID,并具有as键,并提取和汇总它们具有的事务并将其作为值。
唯一mem_id = 例如 70850441974905670928446
金额 = 150.78
card_members = df['unique_mem_id'].unique()
编辑:这是数据帧的摘录:
transaction_date unique_mem_id description amount
6/21/2014 7.08504E+22 HILLERS MARKET NORTHVILLE MI 61.72
6/22/2014 7.08504E+22 BUSCH'S #1032 PLYMOUTH MI 25.48
6/23/2014 7.08504E+22 SPEEDWAY XXXXX 5 M PLYMOUTH MI 30.73
6/23/2014 7.08504E+22 HENDERSON GLASS INC NOVI MI 29.95
6/23/2014 7.08504E+22 HILLERS MARKET NORTHVILLE MI 59.6
6/23/2014 7.08504E+22 SPEEDWAY XXXXX 5 M PLYMOUTH MI 60.59
6/24/2014 7.08504E+22 BEACHWAY RESORT SAUGATUCK MI 1142.4
6/24/2014 7.08504E+22 PUMPERNICKELS EATERY SAUGATUCK MI 88.52
6/24/2014 7.08504E+22 DEMOND'S SUPER DOUGLAS MI 79.75
6/25/2014 7.08504E+22 DEMOND'S SUPER DOUGLAS MI 128.21
编辑结束
DatetimeIndex: 852 个条目, 2014-06-21 至 2020-01-23 数据列 (共 4 列): # 列 非空计数 Dtype
--- ------ -------------- -----
0 transaction_date 852 非空 datetime64[ns]
1 unique_mem_id 852 非空对象
2 描述 852 非空对象
3 数量 852 非空 float64
dtypes: datetime64ns, float64(1), object(2) 内存使用量: 53.3+ KB
这是我尝试编码的字典:
#test for transactions
from collections import defaultdict
transaction_dict = defaultdict(list)
for row in df_card.items():
try:
key = card_members
value = df_card.amount
except ValueError:
continue
transaction_dict[key] += value
print(transaction_dict)
出现的错误是:不可哈希的类型:'numpy.ndarray'
我也尝试过df_card.iterrows(),但这也失败了:(
慕勒3428872
潇湘沐
哆啦的时光机
相关分类