我有一个 df 原始调查数据类似于以下 12000 行和 40 个问题。所有回答都是分类的
import pandas as pd
df = pd.DataFrame({'Age' : ['20-30','20-30','30-45', '20-30','30-45','20-30'],
'Gender' : ['M', 'F', 'F','F','M','F'],
'Income' : ['20-30k', '30-40k', '40k+', '40k+', '40k+', '20-30k'],
'Question1' : ['Good','Bad','OK','OK','Bad','Bad'],
'Question2' : ['Happy','Unhappy','Very_Unhappy','Very_Unhappy','Very_Unhappy','Happy']})
我想根据年龄、性别和收入对每个问题的回答进行分类,为每个问题生成一个频率(按百分比)表
交叉表产生了太多类别,即它按收入和收入、年龄等细分。所以我不确定如何最好地解决这个问题。我确定这是一个简单的问题,但我是 python 的新手,希望得到任何帮助
SMILET
相关分类