splitstackshape

0熱度

1回答

，我有以下數據 path value 1 b,b,a,c 3 2 c,b 2 3 a 10 4 b,c,a,b 0 5 e,f 0 6 a,f 1 DF df <- data.frame (path= c("b,b,a,c", "c,b", "a", "b,c,a,b" ,"e,f" ,"a,f"), value = c(3,2,10,0,0,1)) 我想要

3熱度

3回答

將多個列拆分成多行

我正在處理一組非常原始的數據，並且需要對其進行整形才能使用它。我試圖分裂選定列基於分隔符'|' d <- data.frame(id = c(022,565,893,415), name = c('c|e','m|q','w','w|s|e'), score = c('e','k|e','e|k|e', 'e|o')) 是否有可能在一個，所以它看起來像這樣在最後的數據幀分割

3熱度

2回答

修改cSplit_e函數以解釋多個值

我知道「splitstackshape」中的「cSplit_e」可以用來轉換一列下的多個值，以便用二進制值分隔列。我正在處理用於計算tf-idf的文本問題，並且在列的下方顯示所有唯一值並不是必須的。例如， docname ftype doc_text 1 mw hello, hi, how, are, you, hello 2 gw hi,yo,m

0熱度

2回答

複雜變量的一個熱門編碼

我有一個數據集，我的所有數據都是分類的，我想用一個熱門編碼進行進一步分析。我想主要問題需要解決：一些細胞中含有很多的文字在一個單元（一個例子如下）。某些數值需要更改爲進一步處理的因素。數據與3個標題的時代，信息&目標 mydf <- structure(list(Age = c(99L, 10L, 40L, 15L), Info = c("c(\"good\", \"bad\", \"

2熱度

1回答

如何將特定函數應用於R的範圍（但將其應用於每個列）？

如何我看起來工作數據（它是一個SNP數據）： AA CC CA GG GA CA CC GG GG CCCC CAA GG CA GG CC GC 我怎麼想以後的情況下2（第3行由於多個字符列2和所有列分成刪除它成爲2） A A C C C A G G G A C A C C G G C A G G C C G C 情況1 我在那一刻使用 mydata <- mydata[whi

7熱度

2回答

使用sep =「。」「fread」from「data.table」

fread可以從「data.table」中強制成功使用"."作爲sep的值嗎？我試圖使用fread來加快我在"splitstackshape"中的concat.split函數。關於我正在採取的一般方法，請參閱this Gist，爲什麼我要進行切換，請參閱this question。我遇到的問題是將點（"."）當作sep的值。每當我這樣做，我都會收到「意想不到的字符」錯誤。下面的簡化示例演示了

1熱度

3回答

使用merged.stack從大表創建一個長表（或重塑）

我有一個數據幀，看起來像這樣： ID rd_test_2011 rd_score_2011 mt_test_2011 mt_score_2011 rd_test_2012 rd_score_2012 mt_test_2012 mt_score_2012 1 A 80 XX 100 NA NA BB 45 2 XX 90 NA NA AA 80

-1熱度

1回答

如何每列中一個行中的R

分離柱拆分我想到每一列中的4行從輸入數據分割到低於其它分開的一列中所示的專家輸出輸入 cytoband 11qE2 1qC1.1 13qD2.1 q value 1.16 1.53 1.13 wide 11:119210 1:50490 13:107190 genes Aatk,Actg1,Alyref Tin,Ern Alk,Nf12 預期