2016-10-19 104 views
1

在TensorFlow文檔中提到:「通過密集嵌入,深層模型可以更好地推廣並對訓練數據中以前未見過的特徵對進行預測。」TensorFlow中的特徵選擇

我們如何在代碼中使用密集的嵌入並獲得TensorFlow使用的新特性,它使用泛化和記憶?

或者把它放在另一種方式,如何使用TensorFlow作爲特徵選擇算法?

Source

回答

2

張量流確實既特徵選擇和特徵變換優化以概括針對使用合適的正則化的驗證集時選擇最佳模型。但是,選定的輸入要素很難在密集的深層模型中發現。寬模型(1層)表明哪些特徵與問題最相關。這些充當邏輯迴歸層,邊的權重表示要素的相對重要性。 Abalation是另一種通過訓練NN而不需要一個評估功能來進行特徵選擇並注意指標下降的方法。

密集嵌入可以被視爲適合訓練實例的輸入特徵的複雜變換。它們不能很好地適用於您的測試集中的不可見數據。他們通過定義張量獲得:tf.contrib.layers.embedding_column

+0

謝謝。我將使用tf.contrib.layers.embedding_column獲取功能。 – Androidification