splitstackshape

    0熱度

    1回答

    ,我有以下數據 path value 1 b,b,a,c 3 2 c,b 2 3 a 10 4 b,c,a,b 0 5 e,f 0 6 a,f 1 DF df <- data.frame (path= c("b,b,a,c", "c,b", "a", "b,c,a,b" ,"e,f" ,"a,f"), value = c(3,2,10,0,0,1)) 我想要

    3熱度

    3回答

    我正在處理一組非常原始的數據,並且需要對其進行整形才能使用它。我試圖分裂選定列基於分隔符'|' d <- data.frame(id = c(022,565,893,415), name = c('c|e','m|q','w','w|s|e'), score = c('e','k|e','e|k|e', 'e|o')) 是否有可能在一個,所以它看起來像這樣在最後的數據幀分割

    3熱度

    2回答

    我知道「splitstackshape」中的「cSplit_e」可以用來轉換一列下的多個值,以便用二進制值分隔列。我正在處理用於計算tf-idf的文本問題,並且在列的下方顯示所有唯一值並不是必須的。例如, docname ftype doc_text 1 mw hello, hi, how, are, you, hello 2 gw hi,yo,m

    0熱度

    2回答

    我有一個數據集,我的所有數據都是分類的,我想用一個熱門編碼進行進一步分析。 我想主要問題需要解決: 一些細胞中含有很多的文字在一個單元(一個例子如下)。 某些數值需要更改爲進一步處理的因素。 數據與3個標題的時代,信息&目標 mydf <- structure(list(Age = c(99L, 10L, 40L, 15L), Info = c("c(\"good\", \"bad\", \"

    2熱度

    1回答

    如何我看起來工作數據(它是一個SNP數據): AA CC CA GG GA CA CC GG GG CCCC CAA GG CA GG CC GC 我怎麼想以後的情況下2(第3行由於多個字符列2和所有列分成刪除它成爲2) A A C C C A G G G A C A C C G G C A G G C C G C 情況1 我在那一刻使用 mydata <- mydata[whi

    7熱度

    2回答

    fread可以從「data.table」中強制成功使用"."作爲sep的值嗎? 我試圖使用fread來加快我在"splitstackshape"中的concat.split函數。關於我正在採取的一般方法,請參閱this Gist,爲什麼我要進行切換,請參閱this question。 我遇到的問題是將點(".")當作sep的值。每當我這樣做,我都會收到「意想不到的字符」錯誤。 下面的簡化示例演示了

    1熱度

    3回答

    我有一個數據幀,看起來像這樣: ID rd_test_2011 rd_score_2011 mt_test_2011 mt_score_2011 rd_test_2012 rd_score_2012 mt_test_2012 mt_score_2012 1 A 80 XX 100 NA NA BB 45 2 XX 90 NA NA AA 80

    -1熱度

    1回答

    分離柱拆分我想到每一列中的4行從輸入數據分割到低於其它分開的一列中所示的專家輸出 輸入 cytoband 11qE2 1qC1.1 13qD2.1 q value 1.16 1.53 1.13 wide 11:119210 1:50490 13:107190 genes Aatk,Actg1,Alyref Tin,Ern Alk,Nf12 預期