data-manipulation

    3熱度

    1回答

    我試圖根據ID計數連續的幾天無效(consecDaysInactive)。 我已經創建了一個指示變量inactive,在ID爲非活動狀態的日期爲1,在活動狀態時爲0。我也有一個id變量和一個日期變量。我的分析數據集將包含數十萬行,因此效率將非常重要。 我試圖創建的邏輯如下: 每個ID,如果用戶是活動的,consecDaysInactive = 0 每個ID,如果用戶是不活動的,並且是在先前的天活性

    1熱度

    2回答

    假設,如果我考慮兩個表交易和賬戶 其中transaction$account_id包含account$account_id > transaction trans_id account_id amount 1 100 500 2 101 200 3 102 100 4 100 600 5 100 700

    6熱度

    4回答

    每年公司數量可以說我有數據幀: df <- data.frame(City = c("NY", "NY", "NY", "NY", "NY", "LA", "LA", "LA", "LA"), YearFrom = c("2001", "2003", "2002", "2006", "2008", "2004", "2005", "2005", "2002"), Y

    1熱度

    3回答

    說我有以下數據集: PlotName<- c(A,B,B,C,D,E,F,F,F) NewValue<- c(1,2,1,3,0,0,2,1,3) OldValue<- c(3,3,1,2,1,3,0,3,1) 我要總結NewValue和OldValue值在PlotName重複元件消除在同一TIPE重複的元素(字母)。例如,對於 'B' 的NewValue = 2 + 1 = 3和的Old

    1熱度

    1回答

    具有這樣的XML替換字符的的XDocument的嵌套元件陣列: <ReplyMessage> <tran> <ser_num>305</ser_num> <time>1490987995</time> <source_type>0</source_type> <source_number>0</source_number> <tran_t

    -1熱度

    1回答

    我有我在Excel中打開.dat文件的形式下的數據和事實證明,這種方式 1::Toy Story (1995)::Animation|Children's|Comedy 2::Jumanji (1995)::Adventure|Children's|Fantasy 3::Grumpier Old Men (1995)::Comedy|Romance 4::Waiting to Exhale

    0熱度

    2回答

    我是學生計算機科學專業的學生和新手R用戶。 以下是我的數據框。 set.seed(1234) df <- data.frame( sex = rep(c('M','F'), 10), profession = rep(c('Doctor','Lawyer'), each = 5), pariticpant = rep(1:10, 2),

    0熱度

    1回答

    這可能是一個愚蠢的問題,但是當我在R中使用H2O Predict函數時,我想知道是否有一種方法可以指定它保留評分數據中的一列或多列。具體而言,我想保留我的唯一ID密鑰。現在,我最終做了一個非常低效的方法,將原始數據集和一個索引鍵分配給分數,然後將分數合併到計分數據集中。我寧願說「評分這個數據集並保留x,y,z ....列」。有什麼建議? 低效的代碼: #Use H2O predict functi

    0熱度

    2回答

    日期範圍的這個向量包含在我的類「字符」的數據框中。該格式取決於日期範圍是否跨越到一個不同的月份: dput(pollingdata$dates) c("Nov. 1-7", "Nov. 1-7", "Oct. 24-Nov. 6", "Oct. 4-Nov. 6", "Oct. 30-Nov. 6", "Oct. 25-31", "Oct. 7-27", "Oct. 21-Nov. 3",

    0熱度

    1回答

    這是非常基本的,但我一直堅持這一段時間了。 我想從數據集hitters.txt刪除觀察-Steven Sax: > dput(hitters[280:290,]) structure(list(AtBat = c(439L, 453L, 528L, 633L, 16L, 562L, 281L, 593L, 687L, 368L, 263L), Hits = c(96L, 103L, 122L,