2012-12-19 84 views
0

我有幾個問題樸素貝葉斯分類器svmlight式數據要求在svmlight式的數據有
1)(目標特徵:值特徵:價值...) 我知道featurevalue是什麼target?這是什麼意思?我想知道這一點,因爲我打算使用寫入該數據的文本文件。使用與槌

2)在一個文件中還有多行(目標特徵:值特徵:值) 每行代表一個文件嗎?比方說,我有50個文件,所以每一行代表一個文件?

3)在我使用svmlight-style數據存儲在這個文本文件後,我想將它傳遞到Naive Bayes ClassifierMALLET。這將如何解決?

+0

哇,沒有人知道這一點:/ – Haseeb

回答

1

按照官方SVMLight位點,訓練集包括線

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info> 

其中每行被定義如下:

<target> .=. +1 | -1 | 0 | <float> 
<feature> .=. <integer> | "qid" 
<value> .=. <float> 
<info> .=. <string> 

「以分類模式中,目標值表示類+1作爲目標值分別表示一個正例,-1表示一個反例,因此,例如,行

-1 1:0.43 3:0.12 9284:0.2 # abcdef 

指定了一個反例,其中要素編號1的值爲0.43,要素編號3的值爲0.12,要素編號9284的值爲0.2,所有其他要素的值爲0.此外,字符串abcdef與該向量可以作爲爲用戶定義的內核提供附加信息的一種方式。類別標籤爲0表示應使用轉導對此示例進行分類。通過轉換分類的示例的預測被寫入通過-l選項指定的文件中。預測的順序與訓練數據中的相同。 「

請參見官方網站http://svmlight.joachims.org/的細節

+0

感謝您抽出寶貴的時間來回答這個問題,但我已經發現了這一點)。? – Haseeb