2015-04-02 81 views
0

我有一個數據幀是序列如何改變因素串中的R

Alpha_Helix = xmlParse("AlphaTbl.Xml") 
all_seq = getNodeSet(Alpha_Helix, path = "//Protein/sequence",) 
all_seq = xmlToDataFrame(all_seq) 

我想找到序列的長度每行中,然後進行一些其他工作列表工作與序列,但無法訪問它們。

當我嘗試:

length(all_seq$text[1]) 
[1] 1 
nchar(all_seq$text) 
Error in nchar(all_seq$text) : 'nchar()' requires a character vector 
nchar(all_seq$text[1]) 
Error in nchar(all_seq$text[1]) : 'nchar()' requires a character vector 


as.character(all_seq) # Works 
[1] "c(117, 91, 8)" 

我怎麼能訪問字符串嗎?

+0

查看str(all_seq),然後將選項stringsAsFactors = FALSE添加到xmlToDataFrame(詳細信息請參閱?data.frame) – 2015-04-02 18:55:53

回答

0

好吧我搜索了一下,發現一些有用的東西。

require(stringi) 
require(stringr) 

str_length(all_seq$text) 
[1] 249 274 261 
stri_length(all_seq$text) 
[1] 249 274 261 

適合我。

0

你有沒有試過在as.character環繞你的載體?

+0

as.character(all_seq)#給我一個長度的計數,但是如何訪問(?) >「c(117,91,81)」 – oaxacamatt 2015-04-02 17:25:08