我已經學會了Logistic迴歸一些日子,我認爲邏輯迴歸的數據集的標籤需要是1或0,是嗎?邏輯迴歸數據集標籤的含義是什麼?
但是,當我查找libSVM庫的regression dataset,我看到標籤值是連續數字(例如1.0086,1.0089 ...),我錯過了什麼?
請注意,libSVM庫可用於迴歸問題。
非常感謝!
我已經學會了Logistic迴歸一些日子,我認爲邏輯迴歸的數據集的標籤需要是1或0,是嗎?邏輯迴歸數據集標籤的含義是什麼?
但是,當我查找libSVM庫的regression dataset,我看到標籤值是連續數字(例如1.0086,1.0089 ...),我錯過了什麼?
請注意,libSVM庫可用於迴歸問題。
非常感謝!
你使用第三方庫或自己編程?一般來說,標籤被用作基礎事實,所以你可以看到你的方法是如何有效的。
例如,如果您的算法試圖預測特定實例可能輸出-1,則地面實況標籤將爲+1,這意味着您沒有成功對該特定實例進行分類。
與其名稱相反,邏輯迴歸是一種分類算法,它輸出以數據點爲條件的分類概率。因此,訓練集標籤必須爲0或1.對於您提到的數據集,邏輯迴歸不是一種合適的算法。
支持向量機是一種分類算法,它使用輸入標籤-1或1.它不是概率算法,它不輸出類概率。它也可以適應迴歸。
請注意,「迴歸」是一個通用術語。說某人將執行迴歸分析並不一定告訴你他們將使用什麼算法,也不一定告訴你數據集的所有性質。它真正告訴你的是,你有一組樣本具有你想用來預測單個結果值(一個條件概率模型)的特徵。
邏輯迴歸和線性迴歸之間的一個主要區別是前者通常在分類的二元標籤樣本集上進行訓練;而後者則通過實際標記的(ℝ)樣本集進行訓練。
任何時候,您的標籤實值,這意味着你可能要使用線性迴歸或類似的,否則那些實值標籤轉換爲分類標籤(例如,通過閾值或區間),如果你想在實際使用邏輯迴歸。儘管如此,如果您嘗試從一個此類問題設置轉換爲另一個問題設置,您的結果的質量和解釋可能會有很大差異。請參閱Regression Analysis。
你的意思是數據集不能用於迴歸?但是它的類型叫做「迴歸」,請查看這裏:http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/ – MrROY
你可以使用數據集進行迴歸 - 就像你說的那樣,這就是這是爲了。但是你不能對它應用邏輯迴歸。 –