删除重复行

首页课程实战体系课手记专栏慕课教程

删除重复行

我读过CSV文件放入R数据帧中。一些行在其中一个列中具有相同的元素。我想删除该列中重复的行。例如：

platform_external_dbus 202 16 google 1

platform_external_dbus 202 16 space-ghost.verbum 1

platform_external_dbus 202 16 localhost 1

platform_external_dbus 202 16 users.sourceforge 8

platform_external_dbus 202 16 hughsie 1

我只想要这些行中的一行，因为其他行在第一列中有相同的数据。

GCT1015

浏览 814回答 3

3回答

冉冉说

只需将数据帧与所需的列隔离，然后使用唯一的函数：d。# in the above example, you only need the first three columnsdeduped.data <- unique( yourdata[ , 1:3 ] ) # the fourth column no longer 'distinguishes' them, # so they're duplicates and thrown out.

0 0

慕斯王

对于来此寻找重复行删除的一般答案的人，请使用!duplicated():a <- c(rep("A", 3), rep("B", 3), rep("C",2))b <- c(1,1,2,4,1,1,2,2)df <-data.frame(a,b)duplicated(df)[1] FALSE  TRUE FALSE FALSE FALSE  TRUE FALSE  TRUE> df[duplicated(df), ]  a b2 A 16 B 18 C 2> df[!duplicated(df), ]  a b1 A 13 A 24 B 45 B 17 C 2答复：从R数据帧中删除重复行

0 0

牛魔王的故事

功能distinct()在dplyr包执行任意重复删除，允许指定重复变量(如本问题)或考虑所有变量。数据：dat <- data.frame(a = rep(c(1,2),4), b = rep(LETTERS[1:4],2))删除指定列重复的行：library(dplyr)dat %>% distinct(a, .keep_all = TRUE)   a b1 1 A2 2 B删除与其他行完全重复的行：dat %>% distinct   a b1 1 A2 2 B3 1 C4 2 D

0 0

随时随地看视频慕课网APP