2
我有一個2級數據集,我應該在其上應用二進制分類算法。該數據集看起來如下:元組數據集上的二進制分類
A1,A2,A3,...... +1
......
B1,B2,B3,.......- 1
.......
其中每個特徵/屬性值是2元組。例如,a1是(a1_1,a1_2)。 a1_1和a1_2之間存在依賴關係(儘管此時我不確定相關性如何),並且它們的順序並不重要。類似的情況也適用於負面的類實例。
我正在尋找一些分類這些實例的方法。請讓我知道這樣的算法是否存在。首先,我嘗試拆分元組 - a1_1和a1_2爲一個實例形成了兩個單獨的列,導致每個實例的特徵值數量增加了兩倍 - 並使用LIBSVM(C/C++)庫,但結果是不好。我認爲分割元組並沒有意義,因此尋找合適的方法。
我可以給我一些更多的問題。每個元組的第二個組件(對於所有功能)實際上屬於一個實體/實例。也就是說,我不是屬於一個類的常規單個實例,而是具有屬於+/- 類的相同特徵集的兩個實例。將實例分成兩個單獨的+/- 類實例是沒有意義的。我必須將實體放在一起並將它們稱爲單個實例來解決我的問題。關於你的觀點:4)你的問題得到了回答? 1)同意,不僅使問題變得更加困難,算法也不斷地學習特徵之間的關係。 – Jey