2011-03-16 18 views
6

我有一組60D形狀上下文向量。這些是使用5個徑向倉和12個角倉(從而,我有400個形狀上下文矢量60D)的輪廓中的400個邊緣點的樣本構建的。從60D(形狀上下文)空間投影到2D進行可視化分析

我想分析這些矢量在表示底層輪廓的整體形狀時的描述性。要做到這一點,我想將60D形狀上下文向量投影回二維空間並對結果進行視覺檢查 - 我希望看到的是一組類似於原始輪廓形狀的點。

這樣做的方法是通過投影前兩個主成分(PCA)。根據我的實施情況,投影點不像輪廓的形狀。我可以看到兩個主要原因(假設我的實現是正確的):(1)形狀上下文或者不適合作爲描述符給出輪廓,或者它的參數需要更好地調整(2)這種分析方法有缺陷/無效。

我的問題是,這是否是正確的方法來分析與我的輪廓形狀有關的形狀上下文的描述性?如果不是,有人可以解釋爲什麼並提出一種替代方法嗎?

感謝,

喬希

回答

2

好點的方法來檢查的功能是否是描述性,是儘量在他們訓練的一些分類器(SVM /貝斯/樹/其他),並檢查它的交叉驗證精度/召回等。您還可以通過功能選擇器(如Chi/infogain)過濾您的特徵向量。

除了PCA,您可以使用SOM或集羣可視化您的數據。

+1

感謝您的回覆;正如我所建議的那樣,我將使用形狀上下文描述符來訓練分類器,並瞭解我作爲第一步獲得的性能。你提到聚類數據,但我怎麼能看到這是60D? – Josh 2011-03-18 10:31:37

+0

集羣可以使用例如流行的Treemap Visalisation和相關組將數據可視化爲樹(分層集羣)。此外,分類還爲您提供了新的維度 - 您可以使用這些維度來查看實例對分類器的看法。 – yura 2011-03-21 10:29:09

1

我認爲這種分析方法存在缺陷/無效。我認爲這也是一個類似的推理:我可以通過對每個足球運動員所看到的PCA進行PCA來重建足球場上的觀點。期待這一點是不合理的。

我認爲最簡單的方法來分析形狀上下文的描述性是下載MNIST或一些其他數據庫的書面數字,並計算形狀相似性5個1和5個2 10x10矩陣,然後繪製此圖(說)graphviz。

+0

感謝足球場的比喻;它使得它在概念上更清晰。不過,我相信這個比喻並不意味着這個領域的頂視圖不能由每個球員看到的東西來近似。如果你能詳細說明這一點,以解釋爲什麼每個球員觀點的組合不能形成一個粗略的視野,那麼這對理解這種方法的缺陷將非常有用。另外,我認爲最好使用我的數據而不是MNIST(因爲問題可能是數據特定的,所以我使用形狀上下文來檢查MNIST數據集)。 – Josh 2011-03-18 10:41:21