2013-11-28 68 views
0

我是一名在計算機視覺領域從事研究和工作的初級工程師。越來越多的我發現我陷入困境或被困在項目中,因爲我沒有足夠的關於視頻格式的低級知識。我在談論編解碼器,容器,壓縮,顏色格式,傳輸協議等。首先,我們想到了諸如PAL,NTCS,DVB-T,YUV,YCbCr,H.264,MPEG,隔行掃描,逐行掃描等的縮略語和術語。例如,我希望能夠簡單地通過觀看視頻幀來獲得像this這樣的答案。視頻格式入門?

在我看來,這是一個難以打破的知識領域。對於計算機圖形來說,有OpenGL Super Bible,對於AI有Russel and Norvig; 是否有一些權威的,介紹性的書籍或知識來源,這個行業的人可以推薦?理想情況下,包括編程示例(例如,如何手動實現H.264解碼例程?)。在接下來的五年閱讀官方規格之後,我不確定如何擴展我在這方面的知識。

回答

1

不是我所知道的。我花了很多時間閱讀官方規格(此時超過5年)。諷刺的是,我一直在想寫這個墓。我只是不確定市場潛力。

我可以指出一些。不過我最喜歡的資源:

首先是ITU-T的出版物。這些是官方標準。 http://www.itu.int/en/ITU-T/publications/Pages/default.aspx

我似乎參考了很多書video demystified。對於基本的編解碼器介紹,我喜歡An Introduction to Video Compression in C/C++。我認爲videos at xiph.org真的很棒。

1

幾年前,我寫了這個基本介紹Multimedia Technology Basics。至少,這應該可以幫助您進行YUV/YCbCr格式識別。

你想研究什麼取決於你想要(或需要)完成什麼。你需要編寫編碼器還是解碼器?實現一個H.264解碼器並不是一件微不足道的事情,甚至不是一箇中間的多媒體任務 - 我懷疑你想要這樣做,除非你真的好奇解碼算法背後的低級細節(我絕對是 - - 看我的手柄)。加速編程多媒體壓縮方案的溫和方法是解決JPEG解碼器問題。這是我寫的一篇博客文章:Learn Multimedia Programming By Writing A JPEG Decoder

這裏不乏文獻和視頻,直接進入核心數學的多媒體細節,但我不鼓勵這種方法(因爲它往往會嚇倒很多的人)。所以要小心。不要害怕在這裏發佈更多具體問題,關於更精確的視頻和多媒體主題。