one-hot

    32熱度

    3回答

    說我有一個明確的功能,顏色,其採用的值 [「紅」,「藍」,「綠」,「橙」], ,我想用它來預測某事在隨機森林裏。如果我對它進行一次熱編碼(即將其更改爲四個虛擬變量),我如何告訴sklearn這四個虛擬變量實際上是一個變量?具體來說,當sklearn隨機選擇要在不同節點上使用的功能時,它應該包括紅色,藍色,綠色和橙色虛擬的一起,或者它不應該包含任何一個。 我聽說沒有辦法做到這一點,但我會想象必須有一

    9熱度

    2回答

    我有一個整數類標籤的字節張量,例如來自MNIST數據集。 1 7 5 [torch.ByteTensor of size 3] 如何使用它來創建1熱矢量的張量? 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 [torch.DoubleTensor of size 3x10] 我知道我可以用一個循環做到這一

    2熱度

    1回答

    散列降低了維度,而單熱編碼通過將多分類變量轉換爲許多二進制變量實質上打破了特徵空間。所以看起來他們有相反的效果。我的問題是: 對相同的數據集做這兩個有什麼好處?我讀了一些關於捕獲交互但不詳細的內容 - 有人可以詳細說明這一點嗎? 哪一個先來,爲什麼?

    2熱度

    1回答

    下面的代碼工作正常,但使用eval(),我認爲這會效率低下。有沒有更好的方法來實現相同? import tensorflow as tf import numpy as np sess = tf.Session() t = tf.constant([[4,5.1,6.3,5,6.5,7.2,9.3,7,1,1.4],[4,5.1,9.3,5,6.5,7.2,1.3,7,1,1.4],[4,3

    5熱度

    1回答

    我想爲一組DNA序列生成一個熱編碼。例如,序列ACGTCCA可以用轉置方式表示如下。但是下面的代碼會以水平方式生成一個熱點編碼,我更喜歡它的垂直格式。誰能幫我? ACGTCCA 1000001 - A 0100110 - C 0010000 - G 0001000 - T 示例代碼: from sklearn.preprocessing import OneHotEncoder im