R中考虑两列的唯一行，无顺序

3回答

www说

有很多方法可以做到这一点，这是一种：unique(t(apply(df, 1, sort)))duplicated(t(apply(df, 1, sort)))一个给出唯一的行，另一个给出掩码。

1 0

慕的地8271018

如果只有两列，则还可以使用pmin和pmax，如下所示：library(data.table)unique(as.data.table(df)[, c("V1", "V2") := list(pmin(V1, V2),                         pmax(V1, V2))], by = c("V1", "V2"))#    V1 V2# 1:  a  b# 2:  b  d# 3:  c  e使用“ dplyr”的类似方法可能是：library(dplyr)data.frame(df, stringsAsFactors = FALSE) %>%   mutate(key = paste0(pmin(X1, X2), pmax(X1, X2), sep = "")) %>%   distinct(key)#   X1 X2 key# 1  a  b  ab# 2  b  d  bd# 3  c  e  ce

0 0

湖上湖

如果所有元素都是字符串（哎呀，即使不是，也可以强迫它们），那么一个技巧就是将其创建为data.frame并在其中使用一些dplyr技巧。library(dplyr)df <- data.frame(v1 = c("a","b","c","b"), v2 = c("b","d","e","a"))df$key <- apply(df, 1, function(s) paste0(sort(s), collapse=''))head(df)##   v1 v2 key## 1  a  b  ab## 2  b  d  bd## 3  c  e  ce## 4  b  a  ab该$key列现在应该告诉您重复。df %>% group_by(key) %>% do(head(., n = 1))## Source: local data frame [3 x 3]## Groups: key##   v1 v2 key## 1  a  b  ab## 2  b  d  bd## 3  c  e  ce

0 0