2014-11-04 32 views
0

我有一個ARRF文件,該文件是這樣處理%符號的字符串屬性在秧雞

@relation training_set 
@attribute URL string 
@attribute DOI numeric 
@attribute ISBN numeric 
@attribute Conclusions numeric 

@attribute Source_Type {Scientific, Non_Scientific} 
@data 
http://www.nejm.org/doi/full/10.1056/nejmra1002842 , 0 , 0 , 1 , 0 , Scientific 
http://www.plosone.org/article/info%3adoi%2f10.1371%2fjournal.pone.0014270#pone-0014270-t003 , 1 , 0 , 1 , 0 , Scientific 

我有裝載問題這個文件WEKA因爲我在URL數據是「%」符號。我知道%被視爲weka中的評論,但是有沒有辦法獲取這種類型的字符串?我沒有將URL作爲名義數據,因爲它是訓練集中的標識符?

回答

0

通過包裝在單引號括起來的,我能成功加載文件到Weka的(我還添加了另一個屬性來匹配數據的結構):

@relation training_set 
@attribute URL string 
@attribute DOI numeric 
@attribute ISBN numeric 
@attribute Conclusions numeric 
@attribute Binary numeric 
@attribute Source_Type {Scientific, Non_Scientific} 
@data 
'http://www.nejm.org/doi/full/10.1056/nejmra1002842' , 0 , 0 , 1 , 0 , Scientific 
'http://www.plosone.org/article/info%3adoi%2f10.1371%2fjournal.pone.0014270#pone-0014270-t003' , 1 , 0 , 1 , 0 , Scientific 

希望這有助於!