2-3分类变量的特征和可视化
一个分类变量的可视化:频率表(frequency table)、条形图(bar plot)
两个分类变量的关系:关联表(contingency table)、相对频率表(relative frequencies)、分段条形图、相对频率分段条形图、马赛克图(mosaicplot)
一个分类变量、一个数值变量的关系:并排箱图(side-by-side box plot)
side-by-side box plot
横轴月份为分类变量
纵轴温度为数值变量
人数变为百分数
两个分类变量的关系
用百分比表示的称为相对频率表
幸存和年龄之间是相关的
分类变量不能准确计算,用频率表示
两个分类变量的关系:分段条形图、相对频率分段条形图(纵坐标是百分比)、马赛克图
一个分类变量、一个数值变量的关系:并排箱图
一个分类变量的可视化:频率表、条形图
两个分类变量的关系:关联表、相对频率表(按列来看,用百分比计数)
两个分类变量关系:分段条形图、相对频率分段条形图、马克赛图
一个分类、一个数值:并排箱图
一个分类变量的可视化:频率表、条形图
两个分类变量:关联表、相对频率表;分段条形图、相对频率分段条形图、马赛克图(mosaicplot)
一个分类变量、一个数值变量:并排箱图(side-by-side box plot)
横轴是分类变量 纵轴是数值变量
数据体现了三个维度
百分比计数就是相对频率表