2009-06-04 62 views
4

可以從這種媒體中提取什麼樣的語義信息?任何事情都可以,無論是音樂和口語文本之間的區別,檢測不同的聲音(如槍聲或鳥或汽車),檢測室內/室外拍攝或相機運動的強度。音頻/視頻內容提示

我知道有manymanymanymanymanymany研究這一類的話題,但我沒有找到任何這些的任何應用程序。是否有人鏈接到應用程序/庫/工作原型/有關這些主題即將推出的產品的新聞?

+0

你的意思是像JPEG圖片的EXIF信息? – 2009-07-29 11:11:06

+0

不是,不是關於媒體的技術信息,而是像這樣的:'這張照片是戶外拍攝的'或'這張照片中有人'或'這個音軌包含口語文本'或'這個音軌包含音樂' – soulmerge 2009-07-29 11:26:29

回答

0

尋找的這個應用程序的最佳話題是,你可能想看看「基於視頻檢索的內容和索引」的研究課題

除此之外:

  • 您可以使用學習技術
  • 您可以使用集羣技術來找到音頻或視頻的相似部分的收到信息(視頻,單幀,或音頻)分類

這是一個應用程序商業移除。商業刪除者通常採用聚類方法來消除電視視頻中的部分廣告。

+0

你與能夠應用這些技術的圖書館有任何聯繫? – soulmerge 2009-11-02 09:22:05

1

查看MP4REG,它是「MP4 Family」文件中代碼點的註冊機構。短片:在QuickTime世界中,媒體的基本物理構建塊被稱爲「Atom」。原子不僅可以包含實際的音頻和視頻,還可以包含技術和非技術元數據。最後一個聽起來很有趣。

如:

  • albm:專輯名稱和曲目編號(用戶數據)
  • jp2i:知識產權信息

我只在這個東西仔細看一次,尊重元數據,我的印象是這是一個快速而寬鬆的世界。您可能需要查看一些低級別的MP4解析工具,這些工具可以讓您檢查真實世界媒體文件的各個原子。我認爲甚至有非官方的(未註冊的)定製原子在特定系統中使用。