2014-05-15 29 views
-1

我有一個很大的數據集,它是來自數據庫的隨機樣本。一些列非常稀疏,在樣本中它們是空的。我如何以編程方式讓R找到空的列,然後從數據集中刪除它們?查找並刪除數據框中空的列

+0

什麼是在這些列,所有的「NA」? – gung

+0

嘗試使用'dataset [,colSums(is.na(dataset)) agstudy

回答

0

採用該試樣表

dd<-data.frame(
    a=1:5, 
    b=1:5, 
    c=rep(NA,5), 
    d=1:5, 
    e=rep(NA,5) 
) 

下面的代碼會查看DD的所有列,看看是否所有的值NA。如果是,那麼它將不包含在最終的數據集中。

dd <- dd[, !sapply(dd, function(x)all(is.na(x))), drop=F]