2011-03-07 158 views
0

我有一個有兩列的表,它們都是連續數據。我檢查了csv文件以確保這些列中只有數字值。然而,當我繪製他們其中一人似乎被視爲非連續的數據,我也得到:Error: Non-continuous variable supplied to scale_x_continuous. 這是我的桌子的小版在ggplot2中提供給scale_x_continuous的非連續變量geom_point圖

budget gross 
1 234  4234 
2 42342  2323 
3 22165  346 
4 290  452 
... 

我想創建一個散點圖,其中總數在y軸上,預算在x軸上。 我試過這個,但我得到了前面提到的錯誤。

p <- ggplot(test, aes(Budget, Gross))+geom_point(alpha=I(1/5), aes(colour=Budget))+ opts(titles="Movies per Year", panel.grid.major = theme_blank(), panel.grid.minor = theme_blank())+scale_x_continuous() 

謝謝你這麼多

+0

您的數據包含專欄預算和毛額,但您對ggplot的調用使用標題案例版本 - 但這不是導致錯誤的原因。 +1的因子理論由馬特 – mdsumner 2011-03-07 04:11:56

+1

有什麼在data.frame使'read。*'函數認爲列是一個因素。如果您使用的是Excel或OOCalc,那麼可能有值前面有「'」(或其他一些污染物) - 如果您可以在線發佈文件,我很樂意看看它)。他們可能會出現價值觀,但他們不是。我總是主張一個清潔的數據框架,但這只是我的迂腐的一面而已。 – 2011-03-07 07:49:43

回答

2

嘗試class(test$Budget)。賠率是R認爲你的專欄是一個因素。如果是這樣的話,你可以通過使用stringsAsFactors選項得到解決此問題,您read.csv()任內:

test <- read.csv(file = "yourdata.csv", stringsAsFactors = FALSE) 

或將其設置爲整個會話:

options(stringsAsFactors = FALSE) 

從個人的經驗,我d推薦後者。我以這種方式啓動我的所有腳本 - 實際上,大多數需要因素的函數會根據需要強制使用其他矢量類型,如果它們不這樣,我將手動指定它。但是擁有一大堆潛藏在你數據中的載體會讓你頭痛不已。

相關問題