2013-12-17 25 views
0

我有一個問題,一直非常執着。 我可以使用標記的數據集(即:包含目標信息的數據集)訓練神經網絡,然後應用另一個沒有標記的數據集?可以訓練帶有標籤的訓練集的神經網絡,並使用沒有標籤的數據集對其進行測試?

我想用我的例子來訓練網絡,但是在真實的情況下希望它能夠對例子進行分類(沒有關聯的目標)。例如:

訓練集:

Var1 Var2 Var3 Var4 Target 
1  2  3  1  blue 

測試設置(沒有目標,其實這就是我想知道是什麼)

Var1 Var2 Var3 Var4 
1  2  3  1  

的假設預測必須是藍色的。

我正在使用快速礦工來測試神經網絡,但我很快就明白我無法應用這個測試集,因爲它錯過了標籤。

那麼我該如何解決我的問題呢? 我不知道是否需要探索這個問題的無監督神經網絡,但我真的不這麼認爲。

親切的問候。

+1

第一個問題的答案是「是」:一個訓練有素的分類器需要對其輸入進行預先標記纔是完全沒有用的。 –

回答

1

對於有監督學習,您可以使用帶標籤的訓練集來訓練您擁有的任何模型。 然後,您可以使用該模型預測未標記集的標籤。

如果您碰巧也有測試集標籤,則可以將預測值與測試集標籤進行比較。 這樣你可以評估預測誤差(即測試模型,因此名稱 - 測試集)

如果你只是對預測感興趣,你絕對不需要標籤。

1

對沒有標籤的數據集應用分類器(包括類似mlp的nn)是分類器的實際使用。 但是當你說test你的意思是你想看到質量措施,如false alarm rateprecision,你需要標籤來做到這一點。

假設你想訓練一個分類器,然後在真實的情況下使用它,我強烈建議你測試它與標記的數據之前,並嘗試使用最合適的精度模型。否則,你可能會有大量的錯誤預測,這當然會打擾你。

如果你只有一個帶有少量樣本的標記數據集,你可以嘗試k-fold驗證。