-1
我有一個很大的數據集,它是來自數據庫的隨機樣本。一些列非常稀疏,在樣本中它們是空的。我如何以編程方式讓R找到空的列,然後從數據集中刪除它們?查找並刪除數據框中空的列
我有一個很大的數據集,它是來自數據庫的隨機樣本。一些列非常稀疏,在樣本中它們是空的。我如何以編程方式讓R找到空的列,然後從數據集中刪除它們?查找並刪除數據框中空的列
採用該試樣表
dd<-data.frame(
a=1:5,
b=1:5,
c=rep(NA,5),
d=1:5,
e=rep(NA,5)
)
下面的代碼會查看DD的所有列,看看是否所有的值NA
。如果是,那麼它將不包含在最終的數據集中。
dd <- dd[, !sapply(dd, function(x)all(is.na(x))), drop=F]
什麼是在這些列,所有的「NA」? – gung
嘗試使用'dataset [,colSums(is.na(dataset))
agstudy