2016-10-03 17 views

回答

1

通常,PCA是而不是使用。

因爲你然後失去稀缺。出於性能方面的原因,你想擁有稀疏的向量,所以不要使用PCA。

+0

好的,我該如何使用(比方說)一個1000維矢量集?例如對於最近鄰的問題,以找到最相似的圖像。我聽說BOF矢量具有數千個維度,而NN算法處理(至多)數百個維度 – justHelloWorld

+0

將它們視爲* words *。你也不會在文本上運行PCA。這就是「視覺詞彙」的要點,要使用文字技巧。 –

+0

那麼你是否建議使用倒排索引,其中索引的每個單詞都是一個可視詞(與我們的向量的某個維度相對應)? – justHelloWorld