什麼算法可以說我有在數據集中的兩個陣列:到選擇二進制圖像分類
1)第一種是陣列分類爲(0,1) - [0,1,0,1,1, 1,0 .....]
2)第二個灰度圖像向量的陣列成本函數,每個元素中有2500個元素(數字從0到300)。這些數字是來自50 * 50像素圖像的像素。 - [[13 160 239 192 219 199 4 60 ..] [....] [....] [....] [....]]
該數據集的大小相當重要的(約12000個元素)。 我想建立bery基本的二元分類器,它會給出合適的結果。比方說,我想選擇非深度學習,但一些監督方法。 這種情況適合嗎?我已經嘗試過使用各種參數的sklearn的SVM。但結果是不恰當的,並主要由1組成:[1,1,1,1,1,0,1,1,1,...]
什麼是正確的方法?數據集的大小不足以通過監督算法得到好的結果嗎?
在我的情況下,SVM適用於數據集減少的情況。可以說多達3000個元素(12000箇中)最終得分是〜0.7。但如果我想提高準確度,我需要更多的數據來訓練。在這種情況下SVM變得太慢 –
我在這個領域仍然是新的,有時導致「用正則表達式解析HTML」。這就是我發佈這個問題的原因。如果SVM(即使是PCA)不好,那麼我將把它作爲默認設置,並且將更好地專注於構建NN –
如果你仍然想嘗試SVM,看看isomap(sklearn有一個實現),這可能就足夠了。祝你好運探索 – SerialDev