我正在處理數字數據集,顯然它是一個多變量輸出迴歸。我想知道您是否可以在數字數據集中使用多標籤分類,或者僅限於基於文本的分類。是僅用於文本的多標籤分類
例如:Stackoverflow將每個文本/代碼分類爲多個標籤,如python,flask, python2.7
......但是可以用數字來完成這樣的事情。對不起,我知道這是一個noob問題,但我想知道答案。提前致謝。
我正在處理數字數據集,顯然它是一個多變量輸出迴歸。我想知道您是否可以在數字數據集中使用多標籤分類,或者僅限於基於文本的分類。是僅用於文本的多標籤分類
例如:Stackoverflow將每個文本/代碼分類爲多個標籤,如python,flask, python2.7
......但是可以用數字來完成這樣的事情。對不起,我知道這是一個noob問題,但我想知道答案。提前致謝。
當然可以用數字來完成。畢竟,文本本身被轉換爲數字進行分類。但是你不應該爲此使用迴歸。分類顯然是一種情況。
常規分類器(例如,神經網絡)通常具有多個輸出,每個類都有一個輸出。每個輸出都返回輸入向量屬於該特定類的概率。
在標準分類中,可以用最大概率將其分配給類別。在你的情況下,只是將它分配給所有類別p > 0.5
(假設輸出是[0, 1]
,
關於你的問題是多回歸問題還是多分類問題,你無法知道如果您試圖在連續範圍內查找數值(例如,預測給定產品的價格和銷售數量),請選擇迴歸, 。如果你有一些輸入有或沒有的屬性,請選擇分類。
你是否認爲每個SO問題都映射到一個唯一的數字? – Goyo