2

所有層次K-均值聚類的SIFT向量

我正在尋找應用大衛Nister和亨裏克Stewenius的同樣的方法在http://www.wisdom.weizmann.ac.il/~bagon/CVspring07/files/scalable.pdf

在本文中,他們使用了大量的SIFT向量(128 -D)作爲分層k均值聚類的輸入以構建分層視覺詞彙樹。

是否有人知道我可以用來做這個聚類的任何好的庫?

Ps:輸入SIFT描述符的數量很高(70,000,000),我希望這個結果將是一個包含1,000,000葉節點的詞彙樹。

非常感謝。 關於。

回答

2

如果數據處於受支持的格式,OpenIMAJ中的ClusterQuantiser工具應該能夠執行此操作。如果該工具無法使用開箱即用的數據,那麼您可以在1.0.5版本中爲org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeans類(在svn trunk版本中)或org.openimaj.ml.clustering.kmeans.HByteKMeans類中編寫驅動程序。這兩個版本的課程都支持從磁盤流式傳輸數據,因此您不需要在內存中保存所有功能!

爲了完整性,vlfeat也有一個分層的k-means實現,但我不知道它有多大的比例。

從實踐經驗來看,您也可以考慮在聚類之前對特徵進行採樣。我不確定你會從集羣中獲得很多好處。

+0

Jon,謝謝。我剛剛在一週前遇到了OpenIMAJ,當時我使用谷歌隨機搜索。我會研究它,看看它能提供什麼。 – zhenxingDCU