我在Windows操作系統上使用R 3.1.3 32位,並且有一個csv文件 - 逗號分隔 - 有8列和1001行(包括標題)(整個數據集是24000+行)。如何子集R中的文本表
我的目標是拉出「網站」名稱中至少包含「醫院」,「皇家」,「信任」之一的所有行。
> datac <- read.csv("data1c.csv", header = TRUE, colClasses = c("character", "character", "character", "character", "character", "character", "character", "character")))
Error: unexpected ')' in "datac <- read.csv("data1c.csv", header = TRUE, colClasses = c("character", "character", "character", "character", "character", "character", "character", "character")))"
和
> read.csv("data1c.csv", header = TRUE, col.names = c("ODS","Site","NGrouping", "Address1", "Address2", "Address3", "Address4", "Postcode")
Error in match.arg(numerals) : 'arg' should be one of 「allow.loss」, 「warn.loss」, 「no.loss」
和
> subset("data1c.csv", Site=="HOSPITAL")
Error in subset.default("data1c.csv", Site == "HOSPITAL") : object 'Site' not found
和
> x <- matrix(rnorm(8008, 1), ncol = 8)
> y <- c(1, seq(8))
> x <- cbind(x, y)
Warning message:
In cbind(x, y) :
number of rows of result is not a multiple of vector length (arg 2)
我很新的這所以任何幫助,將不勝感激。
每條線路至少有一個語法錯誤。例如,在第一行中,你不需要最後一個''''。在第二個錯過'col.names'參數後的'c'。在'subset'中,你傳遞一個'data.frame',而不是一個文件名(你知道區別嗎?)。 – nicola 2015-03-19 10:32:24
世界上最後一塊代碼與前面的代碼有關嗎?這是功課嗎?在第二個塊上查看列名稱列表,這裏的代碼突出顯示哪一個不像其他列表。 – Elin 2015-03-19 10:53:40