我在一個數據框中有一些醫院數據,從csv讀入。我試着像這樣命令由用戶定義的列col
數據框,然後由醫院的名字:數字數據框列順序不正確
col <- 'Hospital.30.Day.Death..Mortality..Rates.from.Pneumonia'
hospitals.sorted <- hospitals[order(hospitals[,col], hospitals$Hospital.Name),]
但我覺得我失去了一些東西;它似乎像字符串進行排序col
:
> hospitals.sorted
... # so far so good # ...
2749 10.0
2831 10.0
2891 10.0
2837 10.1
2824 10.1
2774 10.1
... # not so good # ...
2856 15.7
2834 15.9
2797 16.0
2835 7.4
2850 7.7
2789 8.1
... # there are some non-numeric values at the very bottom # ...
2806 9.9
2867 9.9
2884 9.9
2808 Not Available
2913 Not Available
2911 Not Available
只是爲了確認該列實際上是在數字:
> sapply(hospitals, mode)
Hospital.30.Day.Death..Mortality..Rates.from.Pneumonia
"numeric"
Hospital.Name
"numeric"
我不知道爲什麼Hospital.Name
是數字時,它顯然不是。
其他的事情我試圖無濟於事:
- 使用
as.numeric(hospitals[,col])
內的order
- 刪除「不可用」值進行排序
我可能會丟失一些基本的東西了。 HALP!
試試'str(醫院)'?您可能有因素問題。 –