2013-08-03 86 views
1

我試圖寫這篇文章的代碼:「提高自動視聽,視頻結構化集羣選擇和事件建模在無監督挖掘」
了它的部分是關於視頻羣集:
「根據顏色直方圖將視頻流分割爲多個鏡頭,以檢測突變和漸進式轉場,每個拍攝結果由一個關鍵幀進行彙總,在拍攝中間拍攝,然後表示爲一個帶有8個分箱的RGB直方圖自下而上的聚類依賴於使用沃德連接的512維顏色直方圖之間的歐幾里得距離。「
我這樣做,並達到數字數組是這樣的:
1.0E + 03 *視頻羣集

3.8334 
3.9707 
3.8887 
2.1713 
2.5616 
2.3764 
2.4533 

在執行樹狀部分後,結果變成了:

174.0103 
175.0093 
176.0093 
177.0093 
178.0093 
178.0093 
179.0093 

但根據文章作者給出的玩具示例,結果應該是如下的間隔:
{47000,50000},{143400,146400},{185320,187880},{228240,231240},{249440,252000} },{346000,349000} 她錯在哪兒è?

回答

0

在第一步中應該有512個維矢量,每幀一個這樣的矢量,或者等價地是512 x n矩陣。

然後在第二個步驟中,我不認爲他們使用內置的層次聚類平原 - 這是不是時間知道,並不會產生間隔,再加上它會擴展爲O(n^3),這是非常糟糕的 - 而是他們使用定製的聚類算法,受分層聚類和Ward的鏈接的啓發,但它在時間間隔上運行;從單幀開始,但是僅加入相鄰區間,而不是像常規分層聚類那樣的任意區間。

+1

所以你認爲他們通過自定義聚類算法達到間隔時間,並且只使用matlab中的樹形圖不會幫助? – samdean

+0

我發現這篇文章是作者作品之一「基於HMMS和音頻視覺整合的自動視頻結構」,在文章中我沒有引用它,但是這對我來說可能是他們使用它clustering.is是否正確?並感謝您的幫助 – samdean

+0

嗯,我沒有閱讀他們的論文。我不認爲他們用另一篇他們沒有引用的論文。但是如果我不得不聚集一個視頻流,我會這樣做。普通的聚類算法將不會產生間隔;如果你想要間隔,你需要把這個約束放入聚類算法中。這可能是一個簡單的修改,它不會在任何地方發佈。 –