回答

2

所有這些方法對於多元數據都更好。除了歷史上用於一維數據的k-means以外,它們全都是,設計時考慮了多變量問題,並且它們都沒有針對1維數據的特定情況進行優化。

對於一維數據,使用核密度估計。 KDE在1d中是一項很好的技術,擁有強大的統計支持,並且很難用於多維集羣。

0

看看K-means clustering algorithm。該算法非常適合聚類一維特徵向量。但是,如果訓練數據集中存在異常值,那麼K表示聚類算法效果不佳,在這種情況下,您可以使用一些先進的機器學習算法。

我建議在爲您的數據集和問題陳述實施機器學習算法(分類,聚類等)之前,您可以使用Weka Toolkit來檢查哪種算法最適合您的問題陳述。 Weka工具包是大量機器學習和數據挖掘算法的集合,可以針對特定問題輕鬆實現。一旦確定哪種算法最適合您的問題,您可以修改或編寫自己的算法實現。通過調整它,你甚至可以達到更高的準確性。您可以從這裏獲得download weka。