我打算爲kmeans聚類使用orange。我已經閱讀了教程,但我仍然有幾個問題想要問:Python KMeans橙色框架
我正在處理高維向量上的聚類問題。 1)是否實現了餘弦距離? 2)我不想給空值賦零。我試過在空字段中沒有任何零,並且出現錯誤:
SystemError: 'orange.TabDelimExampleGenerator': the number of attribute types does not match the number of attributes
如何指示空值? 3)有沒有一種方法可以將「ID」合併到示例表中?我想用一個ID(不分類)標記我的數據以便於參考。我不會將ID列作爲我的數據的官方部分。
4)kmeans聚類有沒有辦法輸出不同的方法? 我更喜歡這種格式的東西:
cluster1: [ <id1>, <id2>, ...]
cluster2: [ <id3>, ... ]
rather than just [1, 2, 3,1 , 2, ... ]
謝謝!