r-factor

1熱度

2回答

我需要根據兩個因素創建一個基於變量的變量（人們希望這是可能的）。比方說，我有數據：使用性別和具體agegroup中值（例如，當agegroup = 1，性別= 1，中位數 d <- data.frame ( agegroup = c(2,1,1,2,3,2,1,3,3,3,3,3,1,1,2,3,2,1,1,2,1,2,2,3) , gender = c(2,2,2,2,2,

7熱度

1回答

涉及因素的data.table分配

我使用data.table（1.8.9）和:=運算符來更新另一個表中的值。要更新的表（dt1）具有許多因子列，並且具有更新（dt2）的表具有類似的列，其值可能不在另一個表中。如果dt2中的列是字符，我會得到一條錯誤消息，但是當我將它們因式分解時，我會得到不正確的值。如何在不將所有因子先轉換爲字符的情況下更新表格？下面是一個簡化的例子： library(data.table) set.see

0熱度

1回答

熊貓：過程細胞依賴關係

我是熊貓新手，請耐心等待;我有一個數據幀答： one two three 0 1 5 9 1 2 6 10 2 3 7 11 3 4 8 12 而一個數據幀B，它代表了A柱之間的關係： one two # these get mutated in place three 1 1 one 0 0 我需要用這個與其他列中的值乘就地值。輸出應該是： one two three

0熱度

1回答

R：做多個因素/水平的計算（虛擬變量）

我有兩個等長的時間序列數據匹配向量：價格（x）和小時（h）。小時從0-23開始。我的小時變量是我的虛擬變量（或因子/水平變量，我猜它在R中被調用）。現在我已經定義了24個不同的虛擬變量，每個小時我輸入我的虛擬變量。因此，例如生成24個圖，看看或計算24個手段等我會輸入： plot.ts（hour1）＃等等所有24. 我想這樣做所有24個變量一樣容易可能？所以我可以運行很多不同的計算。例如，我怎樣

0熱度

1回答

使用if語句從其他因子變量的水平創建因子變量

我需要在我的數據集中產生一些包含來自現有因子變量信息的新因子變量。在第一種情況下，我需要基於特定變量是否出現在具有超過100個級別的特定變量中來生成二元NewVariable。我使用重估（）從plyr包也就是說， NewVar <- if(OldVar1=="helen" | OldVar1=="greg") {NewVar <-revalue(OldVar1, c("hele

1熱度

1回答

如何根據變量中的值和其他變量中的值來對變量中的級別進行排序？

我有一個數據幀尋找像這樣的我準備一個ggplot： txt <- "v1 v2 v3 'Strongly agree' 83.1 var1 'Agree' 14.9 var1 'Disagree' 1.5 var1 'Strongly disagree' 0.6 var1 'Strongly agree' 11.8 var2 'Agree' 36.5 var2 'Disagree'

2熱度

1回答

如何爲因子變量的每個級別應用函數？

我有這樣的功能： remove_outliers<-function(x){ qnt<- quantile(x,probs=0.99) y<- x y[x>qnt]<- NA y} 目的是去除處於數據的前1％（代替它們與NA值）離羣值。我如何在一個因子變量的層次上應用此功能？例如，與組A和B的原始數據集： group share A 100 A 50 A 30 A

0熱度

1回答

搜索R中兩個因子水平的特定相互作用

我正在尋找一種方法來搜索構成數據框行的因素水平之間的特定交互形式。我有一個數據幀，像這樣的，其中，每列是一個單獨的，並且每行的觀察：組合的 A B C D E G H I 1 NA "1" "1" "1" "1" NA "1" "1" 2 "2" "1" "2" "1" "1" NA "1" "1" 3 "1" "2" "2" "1" "1" "1" "1" "2" 4 "1" "2"

4熱度

3回答

如何在R中將因子格式轉換爲數字格式而不更改值？

下面是我想將列「V2」從因子格式轉換爲數值而不改變當前值（0; 0; 8,5; 3）的dataframe df1。 DF1 = V1 V2 V3 X2 X3 4470 2010-03-28 0 A 21.53675 0 4471 2010-03-29 0 A 19.21611 0 4472 2010-03-30 8,5 A 21.54541 0 4473 2010-03-31 3

1熱度

1回答

如何將值分爲因素中的R

我用邏輯迴歸分析得到Y的一些可能性，我做了以下內容： fit.model <- glm (y~ x1 +x2 , data = mydata, family=binomial) pred_model<- plogis(predict(fit.model, mydata)) 現在，我想用0.5的臨界值的概率進行分類yes或no 我想這一點，但沒有可能工作 class <- ifelse(pre