r-factor

    0熱度

    2回答

    我想要droplevels數據框(請不要將此問題標記爲重複:))。 鑑於所有可用的方法只有一個可行。我究竟做錯了什麼? 實施例: > df = data.frame(x = (c("a","b","c")),y=c("d","e","f")) > class(df$x) [1] "factor" > levels(df$x) [1] "a" "b" "c" 方法1不工作: > df1

    2熱度

    1回答

    我不知道爲什麼as.factor功能在通過apply功能應用於R時不起作用? > df.nrow <- 10 > df <- data.frame(col1=sample(c("a","b","c"), df.nrow, TRUE), + col2=sample(c("d","e","f"), df.nrow, TRUE), + col3=sample(c("g","h","

    0熱度

    1回答

    如果考慮下面的代碼: library(ggplot2) df <- as.data.frame(matrix(rnorm(8),4,2)) colnames(df) <- c("x","y") df$dates <- as.factor(c("april", "may", "june", "august")) ggplot(df, aes(x=x, y=y, color=dates))

    0熱度

    2回答

    我試圖將R中的因子值轉換爲數值。我嘗試了各種方法,但不管我做什麼,我都會收到錯誤「由強制引入的NAs」。這裏是我運行的示例代碼和我得到的錯誤: > demand <- read.csv("file.csv") > demand[3,3] [1] 5,185 25 Levels: 2/Jan/2011 3,370 4,339 4,465 4,549 4,676 4,767 4,844 5,05

    5熱度

    2回答

    我想修改data.table中的一組列,作爲因素。如果我事先知道列的名字,我認爲這將是直截了當的。 library(data.table) dt1 <- data.table(a = (1:4), b = rep(c('a','b')), c = rep(c(0,1))) dt1[,class(b)] dt1[,b:=factor(b)] dt1[,class(b)] 但我不這樣做,而

    1熱度

    2回答

    我有一個有四列的數據框,我們稱之爲V1-V4和十個觀察值。 V1-V4中的一個是每行1個,V1-V4中的其他一個是0.我想創建一個名爲NEWCOL的新列,如果V3是1,則取值3;如果V4是1,則取4;否則爲0。 我必須爲許多組變量V1-V4做到這一點,所以我希望解決方案儘可能短,以便它很容易複製。

    0熱度

    1回答

    我有一個簡單的數據爲練習,當我試圖計算每次最大,最小人口區域如下,我收到警告消息,如「In max(state $ time.population [look.at]):沒有非缺失參數爲max;返回-Inf」。我試圖通過每次手動更改「區域」來逐個運行循環,並且它們都工作正常。我不確定那是什麼原因。每個區域都有空間,所以我想知道這是不是原因 - 我試圖將其改爲人物,但它仍然無效......任何人都知

    0熱度

    1回答

    這裏是問題/提示 爲此,產生被隨機地從具有50的平均和爲10的標準偏差的正態分佈繪製1000個的值的矢量。標記這個額外的列「RGENDER」。 更改RGender,使小於50的值標記爲Male,值50或更多標記爲Female。當使用水平()的值$ RGENDER你應該看到「女」和「男」 ** 對於1,我有: stats$RGENDER <- rnorm(1000, 50 ,10) 而對於2.我

    -2熱度

    1回答

    我想在其中一列的值爲0時更改數據框的列中的條目名稱。我試過這種方式,但得到一條錯誤消息。假設我想改變1,2,3,以「A」時,第3列的條目是0 df[ df[ , 3 ] == 0 , c(1,2,4) ] <- "A" 我得到 Warning message: In `[<-.factor`(`*tmp*`, iseq, value = c("A", "A", "A", : inv

    -2熱度

    2回答

    我想預測一個數值變量。我有幾個因素。對於所有這些因素,我有一個數字等值。現在,將這個數值等同於該因子並將其用於預測是完美的。這可能嗎? 如果這是不可能的,我想我將需要用它們的數值替換這些因素。最好的辦法是什麼? 一個例子: df = data.frame(f=c("a","b","a","c"),v=c(2,4,2,6)) lookup = data.frame(name=c("a","b","