tidyr

    1熱度

    2回答

    使用reshape功能,我有一個看起來像這樣的數據: df1 ID Score1 Score2 Score3 1 2 3 1 2 3 2 1 3 2 1 NA 4 1 NA NA 正如你所看到的,我的一些成績的變量有缺失值。 我很想找到所有ID值的最大分數變量。當我嘗試使用pmax(df1$Score1,df1$Score2,df1$Score3)時,我的結果向量包

    0熱度

    1回答

    我有一系列日子的降雨數據。我的目標是根據觀察時間戳之間的差距將非零降雨量值組合成離散事件。 目前,我有一個所有非零降雨觀測數據幀。我想將這些意見歸納爲事件。如果行i和行j之間的時間間隔大於30分鐘,我想要觸發一個新的「事件」/組。這可能使用R:dplyr?

    1熱度

    2回答

    當我嘗試單獨使用(長)字符串值的列: df <- tbl_df(c("Indian | Londen", "Greek | Amsterdam", "Hamburger and BBQ | Paris du Nord")) df <- separate(df, col = value, into = c("var1","var2"), sep = " | ") 我得到它說,有在三處值過多的警

    0熱度

    1回答

    兩個因素變量列這是我的數據https://www.dropbox.com/s/msf0ro8saav7wbl/data1.txt?dl=0(數據A),我想提取「居」爲具有頻率表,這樣我可以計算任何統計分析,例如均值和方差,並繪製如箱線圖使用GGPLOT2 我想在這裏使用重複問題的解決R: How to get common counts (frequency) of levels of two f

    1熱度

    1回答

    我經常使用具有需要分隔字符串值的列的數據框。這是數據錄入程序中的「選擇多個」選項的結果(我不能不幸地改變)。我試過tidyr::separate但這並沒有正確地排列結果。舉個例子: require(tidyr) df = data.frame( x = 1:3, sick = c(NA, "malaria", "diarrhoea malaria")) df <- df %

    1熱度

    2回答

    我已經看過很多其他示例,其中使用了聚集,融合或重塑將寬格式錶轉換爲長格式,但通常這些示例非常簡單。我需要使用收集/融化/重塑(或其他)功能,從而利用這些數據: dt <- data.table(Id=1:4, TopicA_Percent=runif(4,0.0,1.0), TopicB_Percent=runif(4,0.0,1.0), TopicC_Percent=runif(4,0.0,1.

    0熱度

    1回答

    我想自動按Z列上的值對列轉換後的數據框進行列綁定,並將Z列中的值添加到新列名稱中。 每個Z列唯一元素的行數是相同的。 例子: 數據前 Date X Y Z 1 2013-01-01 1.000000 4.000000 A 2 2013-01-01 1.068966 4.034483 A 3 2013-01-01 1.137931 4.068966 A 4 2013-01-01 1.

    -1熱度

    1回答

    分離柱拆分我想到每一列中的4行從輸入數據分割到低於其它分開的一列中所示的專家輸出 輸入 cytoband 11qE2 1qC1.1 13qD2.1 q value 1.16 1.53 1.13 wide 11:119210 1:50490 13:107190 genes Aatk,Actg1,Alyref Tin,Ern Alk,Nf12 預期

    0熱度

    1回答

    我有兩個數據幀每列名 df1: name @one2 !iftwo there_2_go come&go df1 = structure(list(name = c("@one2", "!iftwo", "there_2_go", "come&go")),.Names = c("name"), row.names = c(NA, -4L), class = "data.frame")

    1熱度

    1回答

    我比較兩個向量(data_A_score,data_B_score)與另一向量K1,使用ks.test(), 我得到這樣的結果: score_ref_k1 <- c(0.09651, 0.09543, 0.09122, 0.09458, 0.09382, 0.10158, 0.10339, 0.13594, 0.09458, 0.09296) data_A_score_src <- c