1
我有一個200萬行的data.frame。其中一列是一個字母數字標識,在該列中重複出現,其唯一計數爲300000?R中的因子級別不顯示爲數字
>head(df$ID)
ID
AB00153232de
AB00153232de
AB00153232de
AB00155532gh
AB00155532gh
AB00158932ij
>df$ID<-factor(df$ID)
當我嘗試打印因子變量我得到的是這樣的:
>df$ID
[1] AB00153232de AB00153232de AB00153232de AB00155532gh AB00155532gh AB00158932ij
320668 Levels: AB00153232de AB00155532gh AB00158932ij.....
不被存儲爲數字向量,爲什麼因素是什麼?
我可以用這些水平在向量或數組索引嗎? – TUSHAr
如果你只想在執行'unclass'之後的級別,試試這個:'attributes(unclass(df1 $ ID))$ levels' – Sathish
我有一個data.frame有兩個這樣的因子變量,我從中創建了一個二維數組(矩陣)。我的問題是,如果我嘗試訪問矩陣元素M [「factor1」,「factor2」],R將通過數字級別在內部搜索它,還是通過字符值進行搜索?在第二種情況下,我可能必須編寫額外的邏輯來搜索數值作爲優化步驟。 – TUSHAr