dplyr中的标准评估:总结以字符串形式给出的变量

我想在中引用一个未知的列名summarise。引入的标准评估函数dplyr 0.3允许使用变量来引用列名,但是当您base在内调用R函数时,这似乎不起作用summarise。


library(dplyr)


key <- "v3"

val <- "v2"

drp <- "v1"


df <- data_frame(v1 = 1:5, v2 = 6:10, v3 = c(rep("A", 3), rep("B", 2)))

df看起来像这样:


> df

Source: local data frame [5 x 3]


  v1 v2 v3

1  1  6  A

2  2  7  A

3  3  8  A

4  4  9  B

5  5 10  B

我想删除v1,按v3分组,并对每个组求和v2:


df %>% select(-matches(drp)) %>% group_by_(key) %>% summarise_(sum(val, na.rm = TRUE))


Error in sum(val, na.rm = TRUE) : invalid 'type' (character) of argument

NSE版本的select()工作正常,因为它可以匹配字符串。SE版本的group_by()工作正常,因为它现在可以接受变量作为参数并对其求值。但是,在函数内部使用基本R函数时,我还没有找到获得类似结果的dplyr方法。


无效的事情:


df %>% group_by_(key) %>% summarise_(sum(get(val), na.rm = TRUE))

Error in get(val) : object 'v2' not found


df %>% group_by_(key) %>% summarise_(sum(eval(as.symbol(val)), na.rm = TRUE))

Error in eval(expr, envir, enclos) : object 'v2' not found

我已经检查了几个 相关的 问题,但是到目前为止,没有一个建议的解决方案对我有用。


慕田峪9158850
浏览 666回答 3
3回答
打开App,查看更多内容
随时随地看视频慕课网APP