r-factor

    0熱度

    2回答

    我非常停留在有關彙總分類數據的基本問題上。我的原始數據由UserId,ItemId,CategoryID格式的多個記錄組成。對於每個ItemID都有一個固定的CategoryID。對於每個用戶ID,都有一個固定的GroupID。每個UserId可以有一個artibrary數量的條目,但每個ItemID只能有一個條目。在我閱讀.csv數據的那一刻,我將每列設置爲一個因子。 這裏是一個玩具數據集: u

    4熱度

    1回答

    數據看起來像這樣添加一個因素: statenum casenum vnumber pnumber numfatal 1 48 3081 1 1 1 2 48 3080 5 1 1 3 48 3080 4 1 1 4 48 3080 1 1 1 5 48 3080 2 1 1 6 48 3080 3 1 1 7 48 3079 1

    2熱度

    1回答

    予有這種數據幀的: df<- data.frame(cluster=c('1','1','2','3','3','3'), class=c('A','B','C','B','B','C')) 我想獲得每個簇(1,2,3),其中出現次數最多的類。在平局的情況下,獲得信息也是非常好的,例如類的組合(或者如果不可能,只有NA)。 所以對於我的例子,我想有這樣的事情作爲結果: cluster clas

    2熱度

    1回答

    我有一個問題,並希望你們中的一些人可以幫助我。問題是這樣的:對於包含長度爲n的向量y和具有k個不同級別的因子f的給定數據幀,我想基於f給數據幀分配長度爲k的新變量z。 例子: df <- data.frame(y=rnorm(12), f=rep(1:3, length.out=12)) z <- c(-1,0,5) 注意,我真正z已經構建對應於獨特的因子水平,這也就是爲什麼length(z

    13熱度

    1回答

    我有一個名爲rRna_RDP_taxonomy_phylum文件數據如下: 364 "Firmicutes" 39.31 244 "Proteobacteria" 26.35 218 "Actinobacteria" 23.54 65 "Bacteroidetes" 7.02 22 "Fusobacteria" 2.38 6 "Thermotogae" 0.65 3

    0熱度

    1回答

    我創建了一個包含所有分類變量的決策樹模型。其中一些分類變量有超過100個可能的值。 這是我的代碼: model = rpart(score ~., data = dataset); plot(model) text(model) 的問題是,text(model)註釋與值的相應分類變量的長列表的每個分割節點。這些價值觀被擠入對方,很難看。我正在尋找text(model)的選項來僅顯示變量名稱

    1熱度

    1回答

    我有以下格式的數據幀和我想橫製表表: T1 T2 NN NF FF FF NF FF NN NN NN FF NF NF NF NF FF FF 我可以通過使用表()函數 表中創建一個簡單的交叉製表表(T1, T2) 這給了我下面的輸出: FF FN NF NN FF 2 0 0 0 FN 0 0 0 0 NF 1 0 2 0 然而因子水平NN默認情況下刪除。有沒有一

    2熱度

    3回答

    行 我有一個數據幀: > x = data.frame(var1 = c(0,0,1,1), var = c(0,1,0,1)) 我想另一列添加到該數據幀是因子,基於所述值集合var1和var2。 factor "00" if both are 0 factor "10" if var1 = 1 and var2 = 0 factor "01" if var1 = 0 and var2 =

    0熱度

    1回答

    我需要在R中創建帶有data.frame函數的新數據(這個新數據然後與預測函數一起使用)。我有兩個因素被納入新數據,但他們有不同數量的級別。因素SSD有3個級別和因素Year有4個級別。我用下面的命令: newdata <- data.frame( a = rep(mean(Data$a), 100), b = rep(seq(from = min(Data$b),

    10熱度

    2回答

    標題說明了一切,我在生成它時訂購了一個因子變量,現在我想刪除這個訂單並將它用作無序因子變量。 另一個問題是,如果我在迴歸中使用因子變量作爲預測因子,如果它是有序的(有序的)或簡單的因子變量(分類的),它會對R產生影響嗎?