我有以下数据集,并且im试图通过计算技能在整个集合中出现的次数来构建第三个变量,例如,如果它们在第1组中出现的次数仍然是我们仍然算作的三倍。不太确定从哪里开始。
Group Skill
1 Windows
1 Excel
2 Windows
2 Java
3 Windows
3 Python
4 Python
4 SAS
我要实现的目标是,如果一项技能仅出现在我们称为行业特定的一组中,则出现在一个以上但少于两个的跨行业中,并且出现在两个以上的横向行业中。可能是同一技能在同一组中出现两次的时候,但是我仍然只想打一次。
那么最终结果将是:
Group Skill Type
1 Windows Transversal
1 Excel Sector-specific
2 Windows Transversal
2 Java Sector-Specific
3 Windows Transversal
3 Python Cros-Sector
4 Python Cros-Sector
4 SAS Sector-specific
相关分类