-2

我在短短的一句話分類問題,在這裏我得到了以下信息工作結合詞矢量和標量特性進行分類

輸入 年齡的人的人(1-100) 性別(男的或女)的句子

輸出 標籤(內容類型)

要句子模型的 內容我正在使用word2vec與tfidf結合。我還想添加年齡和性別作爲特徵以及嵌入到分類器中的句子。什麼是正確的方法來做到這一點?由於嵌入是一個n維陣列和年齡,性別是標量。我很困惑如何添加和可視化數據。

回答

0

字嵌入,作爲n維向量,只是n個標量。因此,例如,如果您有300維矢量從單詞向量中導出,然後是年齡標量(1-100),然後是性別標量(可能是0或1),則您的分類器有302個維度的數據維度。

查看sklearn FeatureUnion transformer瞭解將這些不同特徵連接在一起的示例。 (如果這些不同的特徵被縮放以具有更相似的範圍/分佈,則一些分類器可能表現更好。)