melt

    4熱度

    3回答

    我們使用融合和dcast轉換數據從寬 - >長和長 - >寬格式。 有關更多詳細信息,請參閱http://seananderson.ca/2013/10/19/reshape.html。 scala或SparkR都沒問題。 我已經通過這blog和scala functions和R API。 我沒有看到做類似工作的功能。 Spark中是否有等價函數?如果不是的話,還有其他方法可以在Spark中做到嗎

    0熱度

    1回答

    我有以下結構的時間序列數據: dat=data.frame("Year"=rep(2005,31), "Day"=seq(1:31), "JANUARY"=sample(seq(1:100),31,T), "FEBRUARY"=c(sample(seq(1:100),28),NA,NA,NA), "MARCH"=sample(seq(

    0熱度

    1回答

    我試圖以熔化子類別表(CSV),但由於某種原因不能獲得與melt.array期望的結果 我: Region,Sender,Afghanistan,,,, ,,Adult,,Minor,, ,,Male ,Female,Male,Female, EEA,Austria,165,8,6,10, .... 需要: Reg Send Rec Age Gender Value EEA Au

    1熱度

    2回答

    ,我有以下熔化的數據: dat.melt <- structure(list(CellTypes = structure(c(62L, 35L, 73L, 45L, 14L, 22L, 46L, 13L, 68L, 21L, 1L, 10L, 64L, 24L, 72L, 58L, 51L, 9L, 60L, 37L, 34L, 49L, 33L, 2L, 50L, 32L, 11L, 52L

    1熱度

    1回答

    我有一個數據包含3種不同的疾病狀態和幾種結果。疾病位於第一欄,結果以第二欄命名。請參閱附件中的數據。 Disease A B C D E F G H X 0.001527882 0.003459413 0.000648574 0.002127627 0.000847073 0.002628663 0.00000156 0.001697012 X 0.001848781 0.003641997

    1熱度

    1回答

    我正在嘗試創建平均值±標準錯誤的摘要表。到目前爲止,我已經設法從SummarySE函數中提取平均值和se列,但是現在我被卡住了,無法弄清楚如何獲取列名和行名。 數據: structure(list(TREATMENT = c("A", "A", "A", "B", "B", "B", "C", "C", "C", "D", "D", "D", "A", "A", "A", "B", "B", "

    0熱度

    1回答

    在生成非常大的TukeyHSD表之後,我只希望看到adj.p.value列中的< 0.05行。我嘗試了IF和ifelse函數,但它們只生成TRUE/FALSE表。我希望看到整個數據行進行重要的比較。謝謝! 數據 structure(list(Species = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L,

    0熱度

    2回答

    我有兩套觀測爲830和930。我的目標是重塑我的數據幀,使得有一個originID柱,一個830柱,和一個930列的數據集,保持walking各自的小時欄中的值。這基本上是一個反向重塑。有沒有一種快速的方法在R中做到這一點,哪種軟件包最合適? > df originId walking hour 1 359727104 3.440248 830 2 359931904 8.0652

    2熱度

    5回答

    來自基礎R的by函數具有其自己的特殊輸出類「by」,它具有特殊的打印格式。爲了便於把成果轉化爲表,我真的想「借」來安排的結果與指示用於子集因子水平列的數據幀: b <- by(mtcars$mpg, list(mtcars$vs, mtcars$am), function(x) c(length(x), mean(x))) some_reformatting_function(b) # am

    2熱度

    2回答

    比方說,我有這樣的熔融data.frame molten <- data.frame( gene = c("a1", "b1", "a1", "b1", "a1", "b1"), count = c(3, 4, 5, 2, 6, 7), condition = c("A", "A", "B", "B", "C", "C") ) # gene count condit