%in%和==之间的差异

df <- structure(list(x = 1:10, time = c(0.5, 0.5, 1, 2, 3, 0.5, 0.5, 

1, 2, 3)), .Names = c("x", "time"), row.names = c(NA, -10L), class = "data.frame")



df[df$time %in% c(0.5, 3), ]

##     x time

## 1   1  0.5

## 2   2  0.5

## 5   5  3.0

## 6   6  0.5

## 7   7  0.5

## 10 10  3.0


df[df$time == c(0.5, 3), ]

##     x time

## 1   1  0.5

## 7   7  0.5

## 10 10  3.0

%in%和==这里和有什么不一样?


动漫人物
浏览 828回答 3
3回答

跃然一笑

问题是向量回收。您的第一行完全符合您的期望。它检查什么的元素df$time都在c(0.5, 3),并返回它们的值。您的第二行比较棘手。实际上等于df[df$time == rep(c(0.5,3), length.out=nrow(df)),]看到这一点,让我们看看使用vector会发生什么rep(0.5, 10):rep(0.5, 10) == c(0.5, 3)[1]&nbsp; TRUE FALSE&nbsp; TRUE FALSE&nbsp; TRUE FALSE&nbsp; TRUE FALSE&nbsp; TRUE FALSE查看它如何返回每个奇数值。本质上它与向量匹配0.5c(0.5, 3, 0.5, 3, 0.5...)您可以操纵向量以这种方式不产生匹配项。取向量rep(c(3, 0.5), 5):rep(c(3, 0.5), 5) == c(0.5, 3)[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE他们都是假的。您将每0.5匹配3,反之亦然。

白猪掌柜的

在df$time == c(0.5,3)第c(0.5,3)一个以的形式广播df$time,即c(0.5,3,0.5,3,0.5,3,0.5,3,0.5,3)。然后,将两个向量逐个元素进行比较。另一方面,df$time %in% c(0.5,3)检查的每个元素是否df$time属于集合{0.5, 3}。

莫回无

这是一个老话题,但是我在任何地方都没有看到这个答案,它可能与某些人有关。两者之间的另一个区别是对NA(丢失值)的处理。NA == NA[1] NANA %in% c(NA)[1] TRUE
打开App,查看更多内容
随时随地看视频慕课网APP