tidyr

1熱度

2回答

使用reshape功能，我有一個看起來像這樣的數據： df1 ID Score1 Score2 Score3 1 2 3 1 2 3 2 1 3 2 1 NA 4 1 NA NA 正如你所看到的，我的一些成績的變量有缺失值。我很想找到所有ID值的最大分數變量。當我嘗試使用pmax(df1$Score1,df1$Score2,df1$Score3)時，我的結果向量包

0熱度

1回答

根據採樣時間將數據分組爲組

我有一系列日子的降雨數據。我的目標是根據觀察時間戳之間的差距將非零降雨量值組合成離散事件。目前，我有一個所有非零降雨觀測數據幀。我想將這些意見歸納爲事件。如果行i和行j之間的時間間隔大於30分鐘，我想要觸發一個新的「事件」/組。這可能使用R：dplyr？

1熱度

2回答

如何單獨與tidyr較長stringvalues成兩列

當我嘗試單獨使用（長）字符串值的列： df <- tbl_df(c("Indian | Londen", "Greek | Amsterdam", "Hamburger and BBQ | Paris du Nord")) df <- separate(df, col = value, into = c("var1","var2"), sep = " | ") 我得到它說，有在三處值過多的警

0熱度

1回答

計算頻率，獨立的和轉置具有作爲R

兩個因素變量列這是我的數據https://www.dropbox.com/s/msf0ro8saav7wbl/data1.txt?dl=0（數據A），我想提取「居」爲具有頻率表，這樣我可以計算任何統計分析，例如均值和方差，並繪製如箱線圖使用GGPLOT2 我想在這裏使用重複問題的解決R: How to get common counts (frequency) of levels of two f

1熱度

1回答

將新列值依賴於原始數據的數據幀列拆分

我經常使用具有需要分隔字符串值的列的數據框。這是數據錄入程序中的「選擇多個」選項的結果（我不能不幸地改變）。我試過tidyr::separate但這並沒有正確地排列結果。舉個例子： require(tidyr) df = data.frame( x = 1:3, sick = c(NA, "malaria", "diarrhoea malaria")) df <- df %

1熱度

2回答

R使用tidyr，reshape2將多個列集轉換爲行

我已經看過很多其他示例，其中使用了聚集，融合或重塑將寬格式錶轉換爲長格式，但通常這些示例非常簡單。我需要使用收集/融化/重塑（或其他）功能，從而利用這些數據： dt <- data.table(Id=1:4, TopicA_Percent=runif(4,0.0,1.0), TopicB_Percent=runif(4,0.0,1.0), TopicC_Percent=runif(4,0.0,1.

0熱度

1回答

按列值轉換數據並更改列名R

我想自動按Z列上的值對列轉換後的數據框進行列綁定，並將Z列中的值添加到新列名稱中。每個Z列唯一元素的行數是相同的。例子：數據前 Date X Y Z 1 2013-01-01 1.000000 4.000000 A 2 2013-01-01 1.068966 4.034483 A 3 2013-01-01 1.137931 4.068966 A 4 2013-01-01 1.

-1熱度

1回答

如何每列中一個行中的R

分離柱拆分我想到每一列中的4行從輸入數據分割到低於其它分開的一列中所示的專家輸出輸入 cytoband 11qE2 1qC1.1 13qD2.1 q value 1.16 1.53 1.13 wide 11:119210 1:50490 13:107190 genes Aatk,Actg1,Alyref Tin,Ern Alk,Nf12 預期

0熱度

1回答

刪除特殊符號data.frame列的值

我有兩個數據幀每列名 df1： name @one2 !iftwo there_2_go come&go df1 = structure(list(name = c("@one2", "!iftwo", "there_2_go", "come&go")),.Names = c("name"), row.names = c(NA, -4L), class = "data.frame")

1熱度

1回答

組合purrr ::地圖和dplyr給出不一致的結果與一個普通的統計測試

我比較兩個向量（data_A_score，data_B_score）與另一向量K1，使用ks.test（），我得到這樣的結果： score_ref_k1 <- c(0.09651, 0.09543, 0.09122, 0.09458, 0.09382, 0.10158, 0.10339, 0.13594, 0.09458, 0.09296) data_A_score_src <- c