6

我有一些來自音樂家網站的.jpeg。這些圖像由即將到來的節目和樂隊照片海報(現實生活中的樂隊照片)組成。如何檢測照片是否爲海報(不現實)?

下面是一個例子海報:

enter image description here

我沒有在任何現代技術或算法精通(?如果存在的話),但是這是我想我可能會找:

  • 圖片中的文字通常是海報的死亡贈品。
  • 也許現實的照片(即非海報)遵循不同的顏色分佈?
  • 海報可能不太可能在他們臉上 - 但這是一個非常薄弱的​​斷言。

是否有任何分類算法可以檢測圖像是否爲海報?

回答

11

您的問題非常廣泛。 海報照片是沒有明確定義的對象。什麼是海報?在現實生活中,海報往往是照片,或者是照片的組合,或者是有點糾正的照片。

如果我們縮小問題的第一部分 - 樂隊照片和即將到來的演出海報,那麼答案是 - 可能是(儘管我從來沒有見過任何人這樣做)。當你正在尋找一個二元分類器時,我建議採用一些機器學習模型(樸素貝葉斯應該是足夠的,但如果你想使用更復雜的特徵,那麼嘗試SVM,ELM或一些隨機森林/決策樹)並應用它在含有載體編碼的數據:

二進制特徵:

  • 「是存在的圖像上的任何單詞?」 - 你將需要外部文本檢測算法
  • 「有圖像上的數字」 - 事件應該有日期
  • 「有圖像上有個約會」
  • 「有沒有在圖像上的任何面子」

使用樸素貝葉斯將建立有條件的出現概率P(poster|there is a word)P(poster|there is a number)等,這將不僅給你一個分類,而且重要的是如何您featuers(概率接近0.5是一個建議,一個特定的功能是一些見解無用)。

由於可能的照片範圍廣泛,照片會話風格等,我不會使用直方圖等,除非您願意創建真正的大型訓練集。

如果這還不夠,可以將它們更改爲更復雜的特徵,然後使用更強大的分類器,然後使用樸素貝葉斯。

複雜的功能:

  • 多少個字的圖像上有哪幾種?
  • 圖像上有多少個數字?
  • 圖像上有多少日期?
  • 圖像上有多少面孔?
  • 圖像直方圖

而最後一個選項,如果一切都失敗了,你可以嘗試培養一些現代的模型,如對原始圖像的堅定信念網絡。這需要嚴格的計算能力,但結果對於科學界也是非常有價值的。