我需要在数据框中合并一些数据,因为我将在 python 中编码 [顺序关联规则]。
如何合并数据以及我应该在 python 中使用什么算法?先验?FP增长?我在python中使用apriori找不到[顺序关联规则]。他们使用 R
访问地点为250个。唯一ID号为116807,总行数为170万。而且,每个 id 都有 country_code(111 个国家/地区,但我会将它们分类为 10 个国家/地区).. 所以我将它们再合并一个。
以前的数据
index date_ymd id visit_nm country
1 20170801 123123 seoul 460
2 20170801 123123 tokyo 460
3 20170801 124567 seoul 440
4 20170802 123123 osaka 460
5 20170802 123123 seoul 460
... ... ... ...
我需要的
index Transaction visit_nm country
1 20170801123123 {seoul,tokyo} 460
2 20170802123123 {osaka,seoul} 460
斯蒂芬大帝
梵蒂冈之花
相关分类