如何从包含n * NA的数据框中删除行

我有许多大型数据集,共有〜10列和〜200000行。并非所有列都包含每一行的值,尽管至少一列必须包含要存在的行的值,但我想为NA一行中允许的s 设置一个阈值。


我的数据框看起来像这样:


 ID q  r  s  t  u  v  w  x  y  z

 A  1  5  NA 3  8  9  NA 8  6  4

 B  5  NA 4  6  1  9  7  4  9  3 

 C  NA 9  4  NA 4  8  4  NA 5  NA

 D  2  2  6  8  4  NA 3  7  1  32 

我希望能够删除包含2个以上包含NA的单元格的行以获取


ID q  r  s  t  u  v  w  x  y  z

 A 1  5  NA 3  8  9  NA 8  6  4

 B 5  NA 4  6  1  9  7  4  9  3 

 D 2  2  6  8  4  NA 3  7  1  32 

complete.cases删除所有包含any的行NA,并且我知道一个人可以删除NA某些列中包含的行,但是有一种方法可以对其进行修改,以使它对包含哪些列是不确定的NA,但是总数中有多少呢?


或者,通过使用以下方法合并几个数据框来生成此数据框


    file1<-read.delim("~/file1.txt")

    file2<-read.delim(file=args[1])


    file1<-merge(file1,file2,by="chr.pos",all=TRUE)

也许合并功能可以更改?


谢谢


呼啦一阵风
浏览 1064回答 3
3回答
打开App,查看更多内容
随时随地看视频慕课网APP