2014-11-16 93 views
0

在comlex數據框中,我有一個包含我想排除的網絡召回工資(包含NAs)的列加上一列,其中包含1992年至2010年,或多或少是這樣的:R將子集作爲因子變量而不是數字變量處理

q32 pgssyear 
2000 1992 
1000 1992 
NA 1992 
3000 1994 
etc. 

如果我嘗試繪製箱線圖,如:

boxplot(dataset$q32~pgssyear,data=dataset, main="Recalled Net Salary per Month (PLN)", 
    xlab="Year", ylab="Net Salary") 

似乎工作,但來港可能會扭曲計算,所以我想擺脫他們:

boxplot(na.omit(dataset$q32)~pgssyear,data=dataset, main="Recalled Net Salary per Month (PLN)", 
    xlab="Year", ylab="Net Salary") 

然後我得到一個警告消息,pgsyear和q32的長度不匹配,最有可能導致我從q32中刪除了NAs,所以我試圖縮短pgsyear,以便它不包含對應於從Q32柱來港:

pgssyearprim <- subset(dataset$pgssyear, dataset$q32!= NA) 

但隨後pgsyearprim被視爲因子變量:

pgssyearprim 
factor(0)  

,我也得到相同的警告消息,如果我把它介紹給箱線圖公式...

Levels: 1992 1993 1994 1995 1997 1999 2002 2005 2008 2010 
+0

使用'dataset_n < - dataset [!is.na(dataset $ q32),]' – DatamineR

+0

感謝RStudent,這對我很有用! – Asiack

回答

0

當然,他們不會......你只從LHS中刪除一些數據na.omit(dataset$q32)~pgssyear。而是使用!is.na(dataset$q32)作爲子集參數

+0

以某種方式在q32(dataset_n)中創建沒有NAs的獨立數據集並將其引入boxplot命令效果最佳。 – Asiack