2013-10-08 171 views
2

是否有在Vowpal Wabbit數據格式的例子指定多個標籤的方法嗎?多個標籤

我試圖逗號,並沒有抱怨,但我不知道它做什麼,我希望......

所以如:

2,3 | f1:3 f3:23 
2 | f1:2 f3:34 

第一行是一個例子無論是在2類和3類

我看到的vowpal mailing list一些討論,但我不知道,因爲如果有什麼事情發生了。

Tom

+0

我們需要更多的細節。你在做一些多級比較嗎? – Spaceghost

+0

嗨, 沒有這個任務是非常簡單的。我有30個類(他們是話題)。在培訓材料(由文檔組成)中,示例可以屬於多個類(文檔可以屬於多個主題)。 所以我只是想知道我應該如何在VW格式的列車文件中反映這一點。 – Tom

回答

2

它看起來像你應該使用允許多個標籤的CSOAA。它們需要是自然數並且小於或等於K,其中K是類的數量。就像這樣:

1 2 3 class1 | f1:2 f2:3 
4 2 5 class2 | f3:7 f5:3 
2 3 class3 | f4:2 f2:2 

有關更多詳細信息,請參閱Vowpal Wabbit文檔:https://github.com/JohnLangford/vowpal_wabbit/wiki/Cost-Sensitive-One-Against-All-%28csoaa%29-multi-class-example

+0

太好了。非常感謝! – Tom

+0

解決了我原來的問題。 不過,我其實是在尋找一個多標記SVM(監守我想比較的SVM方法到別的我有)。 但是,CSOAA的文檔說,你應該息事寧人的成本函數(所以沒有「鉸鏈」在這裏,我猜)。 對此的任何想法.. ?? – Tom

+0

Sklearn(一個Python庫)有多標籤SVM .. – Spaceghost