2017-10-28 90 views
0

我有一個由圖像組成的訓練集,從女巫我必須預測由固定數量的字母和數字組成的標籤。 將這些標籤添加到張量流中的最佳方式是什麼?我想創建一個數字列表,其中一個用於標籤中的所有字符/數字。 我創建了一個清單,阿拉的可能值:在張量流中餵食標籤的​​最佳方法

__dict = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 
      'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'] 

然後我用字母的指數在__dict變量標籤編碼成數字列表。 例如:

label = abc 
label_encoded = [0, 1, 2] 

這是正確的方法嗎?

回答

1

最好的方法是使用一個唯一的整數爲每個標籤,即AAA = 0,AAB = 1,等

這是方便您使用的位置編碼與基地36(如果字母小寫英文字符+數字)。

我不知道你所面臨的問題,但要注意的是,這可能導致標籤的數量巨大(爲你的分類問題,即輸出類)

+0

這樣,我必須創建所有可能的標籤。它可能非常昂貴。有沒有類似於我最初想到的方式?謝謝。 – Yes92

+0

這取決於問題:如果標籤「aaa」和「bcd」不共享任何內容,那麼它們應該被視爲您的分類問題的不同類別,是的,您必須創建所有可能的標籤。一切都取決於你想達到什麼。 –

相關問題