我有2個關於格式化上下文強盜模型訓練數據的問題。Vowpal Wabbit上下文強盜數據格式化
如果我有諸如以下數據...
1:1:0.2 | d1:us d2:female d3:12
問題1)I從VW維基讀,每一個特徵是任選地隨後通過浮法。如果我有分類特徵(例如我們,女性)作爲價值觀,那麼重新格式化它們的最佳方式是什麼?我想我只是不會將它們後綴爲浮點數,讓它們的默認值爲1.我希望這將實現單熱編碼。
問題2)我已經通過登錄數據如下
1:1:0.2 | us female 12
被錯誤地訓練模型我現在知道的是,「我們」,「女」和「12」爲治療特色默認值爲1.我正確嗎?