r-factor

    1熱度

    1回答

    我保持一些R代碼裏面,我研究這個功能基本上似乎做同樣的工作,在as.vector()但確實它真的是一個模糊的方式。 f2v <- function(x) if (is.factor(x)) levels(x)[x] else x 而且該函數的其中一個用法似乎不必要地調用它。 xx <- as.factor(f2v(x)) 我還是蠻勁於R,所以我只是想知道如果我錯過這裏一些微妙的一點,我看不

    16熱度

    2回答

    我試圖在數據幀df在河改名因素column1水平A的因素之一級我目前的做法是這樣的: levels(df[!is.na(df$column1) & df$column1 == 'A',]) <- 'B' 不拋出任何錯誤或警告,但完全無效。 B是不是已經存在的水平(從試驗和錯誤我開始懷疑是很重要的),所以下面,我第一次嘗試,沒有工作,要麼 df[!is.na(df$column1) & df$c

    2熱度

    1回答

    我正在使用ramdomForest包創建一個隨機森林模型。 5月份的數據集龐大,超過一百萬個200多個變量的觀測值。在用樣本數據訓練隨機森林時,我無法捕獲所有變量的所有因子水平。 因此,當使用predict()預測驗證集時,它將引發錯誤,因爲存在新的因子級別,這些級別在訓練數據中未捕獲。 一種解決方案是確保訓練數據變量包含所有因子水平。但事實證明這是非常乏味的,我並不需要所有的因素水平。 在ran

    6熱度

    2回答

    想象一下,一個數據幀,如下面DF1: df1 <- data.frame(v1 = as.factor(c("m0p1", "m5p30", "m11p20", "m59p60", "m59p60"))) 如何創建一個變量的所有級別的列表?謝謝。

    0熱度

    1回答

    我正在分析R中Limesurvey問卷的一些數據。其中一項調查問題要求人們提供其原籍國,並在國家/地區列表中使用下拉菜單。我創建了一個labelset這與3個字母的ISO國家代碼爲Limesurvey答案代碼和國家名稱作爲標籤: 當導出我的Limesurvey數據R,無論是代碼和標籤被保存到R語法文件中。該代碼保存爲要素的「等級」,標籤是用作標籤課程(簡稱爲清楚起見): data[, 7] <-

    0熱度

    1回答

    我有一個data.table,其中有一些值爲NA的因子列。我故意將NA作爲因素的級別(即x <- factor(x, exclude=NULL),而不是默認行爲x <- factor(x, exclude=NA)),因爲這些NA對我的模型有意義。對於這些因子列,我希望relevel()爲NA的參考水平,但我正在努力與語法。 # silly reproducible example library

    31熱度

    5回答

    我有一個簡單的數據幀象下面這樣: data <- data.frame(matrix(sample(1:40), 4, 10, dimnames = list(1:4, LETTERS[1:10]))) 我想知道我怎麼能選擇多列,並將它們一起轉換爲因素。我通常按​​照像data$A = as.factor(data$A)這樣的方式來做。但是,當數據幀非常大並且包含大量列時,這種方式將非常耗時。

    -1熱度

    1回答

    我有我的[R數據幀2個因子變量和1個邏輯變量: > table(eaos$GM, eaos$CONTRACTOR.FLAG) N Y Belfast 1145 0 East Anglia 7969 207 London 7583 232 North East 8378 113 Nort

    -1熱度

    1回答

    R文檔說nnet::class.ind()根據給定因子生成類指示符函數。 它是否將因素轉換爲某種二元分類? 何時以及爲什麼我們使用此功能?請給我一些例子。 任何幫助表示讚賞。謝謝。

    2熱度

    2回答

    我有一個相當大的數據幀,其中有一個很多級別(超過4,000)的因子。我在同一個數據框中使用另一列作爲參考,並且我希望找到的是每當此引用列爲NA時的級別的子集。 我正在使用的第一步是subsetrows <- which(is.na(mydata$reference))但之後我卡住了。我想要類似levels(mydata[subsetrows,mydata$factor]),但不幸的是,該命令顯示我