r-factor

    1熱度

    2回答

    我需要根據兩個因素創建一個基於變量的變量(人們希望這是可能的)。 比方說,我有數據:使用性別和具體agegroup中值(例如,當agegroup = 1,性別= 1,中位數 d <- data.frame ( agegroup = c(2,1,1,2,3,2,1,3,3,3,3,3,1,1,2,3,2,1,1,2,1,2,2,3) , gender = c(2,2,2,2,2,

    7熱度

    1回答

    我使用data.table(1.8.9)和:=運算符來更新另一個表中的值。要更新的表(dt1)具有許多因子列,並且具有更新(dt2)的表具有類似的列,其值可能不在另一個表中。如果dt2中的列是字符,我會得到一條錯誤消息,但是當我將它們因式分解時,我會得到不正確的值。 如何在不將所有因子先轉換爲字符的情況下更新表格? 下面是一個簡化的例子: library(data.table) set.see

    0熱度

    1回答

    我是熊貓新手,請耐心等待;我有一個數據幀答: one two three 0 1 5 9 1 2 6 10 2 3 7 11 3 4 8 12 而一個數據幀B,它代表了A柱之間的關係: one two # these get mutated in place three 1 1 one 0 0 我需要用這個與其他列中的值乘就地值。輸出應該是: one two three

    0熱度

    1回答

    我有兩個等長的時間序列數據匹配向量:價格(x)和小時(h)。小時從0-23開始。我的小時變量是我的虛擬變量(或因子/水平變量,我猜它在R中被調用)。 現在我已經定義了24個不同的虛擬變量,每個小時我輸入我的虛擬變量。因此,例如生成24個圖,看看或計算24個手段等我會輸入: plot.ts(hour1)#等等所有24. 我想這樣做所有24個變量一樣容易可能?所以我可以運行很多不同的計算。例如,我怎樣

    0熱度

    1回答

    我需要在我的數據集中產生一些包含來自現有因子變量信息的新因子變量。 在第一種情況下,我需要基於特定變量是否出現在具有超過100個級別的特定變量中來生成二元NewVariable。 我使用重估()從plyr包 也就是說, NewVar <- if(OldVar1=="helen" | OldVar1=="greg") {NewVar <-revalue(OldVar1, c("hele

    1熱度

    1回答

    我有一個數據幀尋找像這樣的我準備一個ggplot: txt <- "v1 v2 v3 'Strongly agree' 83.1 var1 'Agree' 14.9 var1 'Disagree' 1.5 var1 'Strongly disagree' 0.6 var1 'Strongly agree' 11.8 var2 'Agree' 36.5 var2 'Disagree'

    2熱度

    1回答

    我有這樣的功能: remove_outliers<-function(x){ qnt<- quantile(x,probs=0.99) y<- x y[x>qnt]<- NA y} 目的是去除處於數據的前1%(代替它們與NA值)離羣值。我如何在一個因子變量的層次上應用此功能? 例如, 與組A和B的原始數據集: group share A 100 A 50 A 30 A

    0熱度

    1回答

    我正在尋找一種方法來搜索構成數據框行的因素水平之間的特定交互形式。 我有一個數據幀,像這樣的,其中,每列是一個單獨的,並且每行的觀察:組合的 A B C D E G H I 1 NA "1" "1" "1" "1" NA "1" "1" 2 "2" "1" "2" "1" "1" NA "1" "1" 3 "1" "2" "2" "1" "1" "1" "1" "2" 4 "1" "2"

    4熱度

    3回答

    下面是我想將列「V2」從因子格式轉換爲數值而不改變當前值(0; 0; 8,5; 3)的dataframe df1。 DF1 = V1 V2 V3 X2 X3 4470 2010-03-28 0 A 21.53675 0 4471 2010-03-29 0 A 19.21611 0 4472 2010-03-30 8,5 A 21.54541 0 4473 2010-03-31 3

    1熱度

    1回答

    我用邏輯迴歸分析得到Y的一些可能性,我做了以下內容: fit.model <- glm (y~ x1 +x2 , data = mydata, family=binomial) pred_model<- plogis(predict(fit.model, mydata)) 現在,我想用0.5的臨界值的概率進行分類yes或no 我想這一點,但沒有可能工作 class <- ifelse(pre