2013-03-05 28 views
0

這不是一個很具體的問題,我只是想從這個論壇的同事那裏收集想法。小數據集多重特徵的決策融合

我的問題是;

我估計人的身高,體型和從一個攝像頭採集的視頻數據布料的顏色,讓我們調用這些功能,我有類似的一組人作爲新的數據集,但是從另一個攝像頭採集。因此,如果要與第一個數據集中的要素匹配(如重新識別),我想識別第二個數據集中的人員,但我很困惑如何將這些要素融合在一起以及如何匹配或排列它們(這就像分類)。

請給我建議和建議。

+0

你能更具體地說明你所擁有的數據以及你想做的預測類型嗎?你能分享一下你認爲/嘗試的方法嗎?具體而言,您是否對第二組數據具有相同的功能(例如高度,尺寸,布料顏色等)? – etov 2013-03-05 08:41:17

+0

@etov,謝謝你的迴應,我在第一個數據集中有100個主題。物體提取後的高度,重量,布顏色都是由此產生的歐幾里得量度。我在第二個數據集中具有相同的功能和主題。在文獻中已經閱讀過(http://www.eurecom.fr/fr/publication/3442/download/mm-publi-3442_1.pdf),他們使用加權參數來融合這些特徵,並且他們使用了與第二數據集相同的東西, ,所以他們做了一些匹配,我不明白導致混淆矩陣(但他們從未使用任何分類器)。 – Olah 2013-03-05 08:56:53

+0

您引用的論文似乎引用另一篇論文,http://www.eurecom.fr/fr/publication/3247/download/mm-publi-3247_1。pdf,它描述了一般的分類方法。它似乎基於樸素貝葉斯分類方法。 – etov 2013-03-05 12:41:41

回答

0

您可以試試Canonical Correlation Analysis。從Wiki頁面摘錄:

實驗上下文典型相關的典型應用是把兩個變量集,看看什麼是共同躋身兩套。

典型相關的結果的可視化通常是通過兩套用於對典型變量的表示顯著相關變量的係數的棒圖。一些作者建議,通過將它們繪製成日照圖,這是一種圓形格式,帶有類似條紋的光線,並且每一半代表兩組變量,例如, "Canonical correlation analysis: Use of composite heliographs for representing multiple patterns"

0

我同意這聽起來像是一個分類問題。你需要設置兩個類,就像人類/非人類一樣。

然後,您必須檢查您選擇的功能是否適合您的特定問題。您可以爲數據庫中的每個人繪製您的功能;這意味着,二維圖x = feature1,y = feature2,爲您的整個數據庫從功能1到n做好準備。它可以讓你知道某項功能是否與任務有關,從而將人類從環境中分類出來。

現在,它看起來像你試圖做二元分類:人類/而不是人類。 SVM適合這樣的任務,但如果您不熟悉它或通常使用machine learning,則可以從更簡單的算法開始,如kNN

不要忘記您的標準化數據之間的假設[0 1],我想原因是很明顯的!一旦你選擇了你的分類算法,你將不得不量化你的算法完成任務的效果。爲此,您可以嘗試cross-validation(請稍等......),然後confusion matrix

玩得開心!