在comlex數據框中,我有一個包含我想排除的網絡召回工資(包含NAs)的列加上一列,其中包含1992年至2010年,或多或少是這樣的:R將子集作爲因子變量而不是數字變量處理
q32 pgssyear
2000 1992
1000 1992
NA 1992
3000 1994
etc.
如果我嘗試繪製箱線圖,如:
boxplot(dataset$q32~pgssyear,data=dataset, main="Recalled Net Salary per Month (PLN)",
xlab="Year", ylab="Net Salary")
似乎工作,但來港可能會扭曲計算,所以我想擺脫他們:
boxplot(na.omit(dataset$q32)~pgssyear,data=dataset, main="Recalled Net Salary per Month (PLN)",
xlab="Year", ylab="Net Salary")
然後我得到一個警告消息,pgsyear和q32的長度不匹配,最有可能導致我從q32中刪除了NAs,所以我試圖縮短pgsyear,以便它不包含對應於從Q32柱來港:
pgssyearprim <- subset(dataset$pgssyear, dataset$q32!= NA)
但隨後pgsyearprim被視爲因子變量:
pgssyearprim
factor(0)
,我也得到相同的警告消息,如果我把它介紹給箱線圖公式...
Levels: 1992 1993 1994 1995 1997 1999 2002 2005 2008 2010
使用'dataset_n < - dataset [!is.na(dataset $ q32),]' – DatamineR
感謝RStudent,這對我很有用! – Asiack