因子:factor处理分类数据,有序或无序
证书向量+标签
X<-factor(c())
levels=极限水平

因子是用来处理分类数据的
有序 例子:年龄低中高
无序 例子:性别男女
因子优于整数向量,因为可以对整数向量进行描述,如你会知道1或者2代表男性还是女性
factor函数:用c将所有人的性别连在一起;输出后得到x的内容;level可以查看因子包含的水平

在factor里面插入第二个函数 levels:levels的第一个参数的就是基线水平

对x有一个基本的了解,使用table函数,可查看不同水平内容的个数:

可以用unclass函数去掉levels:

内容是:
attr显示曾经的level和其内容
用class函数查看unclass之后x变成了什么类别的数据

2-5 factor
因子(factor):分类数据(有序/无序)
可以理解为整数型向量+标签(label)(优于整数向量)
Male/Female vs.1/2
常用于lm(),glm()
创建因子:
x<-factor(c("female","female","male","male","female"))
y<-factor(c("female","female","male","male","female"),levels=c("male","female"))(levels是因子的属性,谁在前谁是基线水平)
table(x)对当前因子有整体性的了解
unclass(x)去掉因子的属性
class(unclass(x))查看unclass(x)的属性
因子
分类数据/有序 vs.无序
整数向量+标签(label)(优于整数向量)
常用于lm(),glm()
创建因子
factor()
table()/unclass()
描述factor可以用table函数,如
x<-factor("female","female","male","male","male")
table(x)
x female male
2 3
levels用在factor内描述其水平 如levels=c("male","female")
因子(factor)—分类数据/有序 vs. 无序
—整数向量 + 标签(label)优于整数向量
x <- factor(c("female","female","male"),levels(“male”,"female")) #可以构建因子,并且可以通过levels设立基线因子t
table(x) #得出x因子的分布表
unclass(x) #将x因子转化为值标签
111111
11111
factor可以看成整数向量加上lable,当对factor进行unclass操作后,去掉了levels之后,class(unclass(x))是“integer”
table()函数对因子进行了解
unclass()函数可以去掉因子的水平来看因子的内容,同时还会告诉你曾经的属性是什么
因子factor用于处理分类数据(数据分为有序的和无序的)
因子优于整数向量,因为因子(整数向量+标签lable)可以对整数进行描述
factor()进行创建,levels水平 可以在创建factor时加入levels参数来修改基线水平
因子是用来处理分类数据(有序、无序两种)的,有序指的是可以比大小的,无序则相反,如性别即是无序的。
因子=整数向量+标签(可对整数向量进行描述),常用于线性模型lm()和一般线性模型glm()
创建因子用factor(),可通过levels(相当于标签)设定谁是基线水平(第一个元素),levels是因子的一个属性
对当前因子进行整体性了解用table(),去掉属性看因子的内容用unclass()
因子可以看做整形加上levels属性;
用factor()函数来创建因子,注意levels;
用table()函数来考察因子的情况;
用unclass()函数去除因子的levels属性;
数据结构-因子
1、创建因子:x<-factor(c("male","female","femal","male"),levels = c("male","femal"))
2、level查看因子的基础值,在统计分析的时候用处较大。
3、unclass(x),去除分类
4、table(x):查看元素的频数
factor 统计中的四种不同分类
有序/无序
level表示标签,设定level之后可以设定标签的顺序,在前的为基线。
table可以统计数量。
unclass,class(unclass(x))
通过levels 来设定因子中的基线水平
因子可以理解为整数向量加标签 , 例如男性用1 表示,女性用2表示。
因子是用来处理分类数据的, 分类数据分为:
有序数据和无序数据
R数据结构
5.因子(factor):整数向量+标签(label),用于处理分类数据(有序和无序)
创建因子:x <- factor(c("female", "female", "male", "male", "female"))
y <- factor(c("female", "female", "male", "male", "female"), levels = c("male", "female")) #通过参数2设置基线水平
table(factor):查看因子数据各类型数量
unclass(facotr):去掉因子数据的水平(level)
> x<-factor(c("female","female","male","male","female"))
> x
[1] female female male male female
Levels: female male
> y<-factor(c("female","female","male","male","female"),levels = c("male","female"))
> y
[1] female female male male female
Levels: male female
> table(x)
x
female male
3 2
> unclass(x)
[1] 1 1 2 2 1
attr(,"levels")
[1] "female" "male"
#因子
创建因子
x<-factor(c("female","female","male","male","female"))#创建一个因子
x<-factor(c("female","female","male","male","female"),levels=c("male","female"))#可使用levels来设定基线水平
table(x)#查看因子
unclass(x)#去掉因子的属性
class()#
分类数据分为: 有序和无序
有序分类数据:年级分为低 中 高,可以比较大小
无序分类数据:性别,不能比较大小
factor因子:整数型向量+标签,例如:
把性别存成1/2, 1代表男性,2代表女性
factor优于整数向量,存成因子,可以对1,和2进行描述,经常用于线性模型
x<-factor(c("female","female","female","male","female"))
输出:levels:female male
x<-factor(c("female","female","female","male","female"), levels=c("male","female"))
输出:levels:male female
#可以通过levels设定,你的因子中谁是基线水平,非常重要
对你当前的因子有一个整体性的描述 ,可以用table()函数
table(x)
输出:female male
3 2
levels是因子的一个属性,可以去掉因子的属性,来看因子的内容,用unclass()函数,输出:11221
class(unclass(x)) #变成一个integer的向量
levels:代表标签
2.5 factor(因子)
--分类数据/有序(e.g. 低中高) vs 无序(e.g. 男女)
--整数向量+标签(label)
male/female vs 1/2
创建因子
x<-factor(c("female","female","male","male","female"))
y<-factor(c("female","female","male","male","female"),levels =c("male","female")) levels代表基线水平,谁在前,谁就是那个基线水平。统计分析中基线水平很重要。
table(x) 了解整体
unclass(x) 去掉属性看内容
因为可以把因子当成整型变量加上一个属性
class(unclass(x))
整型
因子factor:可以理解为整数向量+标签(label)(优于整数向量,每个数字有自己具体的含义)。
2.5 factor(因子)
--分类数据/有序 vs 无序
--整数向量+标签(label)
创建因子
x<-factor(c("female","female","male","male","female"))
y<-factor(c("female","female","male","male","female"),levels =c("male","female")) levels代表基线水品
table(x)
unclass(x) 去掉属性看内容
class(unclass(x)) 整型
因子factor:可以理解为整数向量+标签(label)(优于整数向量,每个数字有自己具体的含义)。
因子的levels就是把哪个变量放在前面
高中低就是有序的