-2

我的問題是initial featuresXÿTHETA,在範圍[0,255]歸一化。聚類及分類稀疏大特徵

對於每個object功能的數量是variable

應用了羣集,因此每個羣集都有多個功能&每個對象都屬於multiple clusters。 在預測階段,從初始特徵計算每個對象的簇(new features)。

每個對象最多屬於10 clusters

集羣總數爲4000

如果我們考慮每個對象的新features constant我們有4000維 它very large for classify。只有10個功能可能是有用的,我的功能是稀疏的。

我的問題:

有沒有我們可以將這些sparse features與分類是有用最佳性能&分類什麼辦法? 注意:我使用局部敏感散列來分類4000維度的新特徵,這非常緩慢。

+0

如果使用線性模型,那麼4000個功能並不是什麼大不了的,這些功能可以擴展到數百萬個功能。但是從你的問題來看,如果你正在進行分類或集羣,這是不明確的。 –

+0

請仔細閱讀問題。集羣總數爲4000個。集羣數量是新特徵的維數。在第一步集羣中,下一步中的數據將對集羣中每個對象的成員資格進行分類。 –

回答

0

我用主成分分析減少的功能,以10個暗淡尺寸則使用的SVM爲新功能&解決了問題分類。