2017-10-09 27 views
-1

我正在處理數字數據集,顯然它是一個多變量輸出迴歸。我想知道您是否可以在數字數據集中使用多標籤分類,或者僅限於基於文本的分類。是僅用於文本的多標籤分類

例如:Stackoverflow將每個文本/代碼分類爲多個標籤,如python,flask, python2.7 ......但是可以用數字來完成這樣的事情。對不起,我知道這是一個noob問題,但我想知道答案。提前致謝。

+0

你是否認爲每個SO問題都映射到一個唯一的數字? – Goyo

回答

1

當然可以用數字來完成。畢竟,文本本身被轉換爲數字進行分類。但是你不應該爲此使用迴歸。分類顯然是一種情況。

常規分類器(例如,神經網絡)通常具有多個輸出,每個類都有一個輸出。每個輸出都返回輸入向量屬於該特定類的概率。

在標準分類中,可以用最大概率將其分配給類別。在你的情況下,只是將它分配給所有類別p > 0.5(假設輸出是[0, 1],

關於你的問題是多回歸問題還是多分類問題,你無法知道如果您試圖在連續範圍內查找數值(例如,預測給定產品的價格和銷售數量),請選擇迴歸, 。如果你有一些輸入有或沒有的屬性,請選擇分類。

+0

謝謝你,我想知道你怎麼能看一個數字問題,並知道如果這是一個多回歸或多標籤問題。我很抱歉要求noob q's,但我得問:) – jason

+0

@jason:編輯。總之,如果數據集中的輸出是連續的,那麼就有迴歸。如果它們是離散的(只有整數值)或文本,你有分類。 –

+0

明白了! 。謝謝。如果我有更多疑問,我可以與您取得聯繫嗎?順便說一句,多標籤和多分類是兩種不同的東西吧? – jason