2011-12-24 29 views
0

對於這個例子的目的,假設存在2個二進制文件A和B,各含有的,比方說一個變型中,YouTube視頻,其中是否可以確定2個文件的相似程度?

  • A包含5秒的廣告
  • B不包含廣告
  • 隨着例外爲廣告,A包含相同的內容爲B
  • 文件A的總長度爲60秒
  • 文件B的總長度是55秒

作爲一般規則,如果我們要比較每個文件的位模式,我們是否會得出相同的結論:文件包含55秒的共同位?

如果我們進一步擴展問題,說2個瓶子的世界,它們之間唯一的區別是評論,比較比特的順序和基於我們發現的東西,確定相似程度是否合適?

很容易確定文件是否相同。比較位的方法是否有助於準確確定文件彼此接近的程度?

這個問題不是關於視頻文件,而是一個普通的二進制文件。我僅提供以上視頻文件僅用於示例目的。

回答

2

它取決於文件格式,但在你的例子中—不,可能不是。

有或沒​​有初始廣告的視頻:視頻通常通過將視頻分成小時間塊進行編碼,然後對這些塊進行編碼和壓縮;如果您在開始時插入廣告,那麼您很可能會導致在主視頻中的不同時間偏移處發生塊轉換。

Jar文件有和沒有評論(或有不同的評論):同樣的故事;更改文件中註釋的長度將影響整個文件分割爲可壓縮塊,因此,修改後的註釋之後的所有塊將被壓縮不同。 (當然,這是假設jar文件實際上包含了註釋,只是因爲註釋在源代碼中,這並不意味着jar文件會擁有它們;這取決於編譯器設置等等。 )

+1

換句話說,你必須理解文件的格式以正確地比較它們,你不能只盲目地看一下這些位。 – Charles 2011-12-24 03:18:48

+1

+1。這就像比較兩個人通過檢查他們的皮膚細胞看起來相似。 – 2011-12-24 03:21:22

+0

@Charles好吧 – JAM 2011-12-24 03:40:14

0

這些天來的大多數視頻壓縮都是用有損算法完成的。壓縮在幀和BETWEEN幀內完成。如果您的「A」視頻中添加的額外視頻幀因爲幀間壓縮而「泄露」到原始電影中,那麼根據定義,您的兩個視頻文件將是不同的視頻,即使邏輯上它們與5幾秒鐘的廣告釘在前面。壓縮算法將兩個視頻中的一個或多個幀合併爲兩者的混合,這從根本上改變了事情。

相關問題