2012-06-04 36 views
7

當我使用N號選擇樣本大小的圖像時,應該使用什麼平均值統計方程?在圖像上查找最受歡迎的區域

我有一個獨特的問題,我希望得到一些建議,以便我不會錯過任何事情。 問題:根據用戶選擇不同選擇比例的區域,找到圖像上最受歡迎/喜歡/重要的區域。

場景:考慮一個Image of a dog,並且數百個用戶在不同的分辨率下選擇該圖像上的區域,在大多數選擇中明顯的焦點區域將是包含該狗的區域。我可以記錄x1,x2,y1,y2座標,並將它們放入一個分貝,現在如果我想在一組分辨率中自動生成這個圖像的版本,我應該能夠識別該區域的最大吸引力用戶。 我認爲可以工作的方法有:

  1. 找到所有選擇的平均中心點,並以此爲基礎進行選擇。 - 非常簡單,但不會那麼準確。
  2. 使用像K Means或EM Clustering這樣的算法,但我不知道哪一個最適合。

期待一些輝煌的解決我的問題

的問題更多信息: 實際影像將會是最有可能是1024×768的圖像,並在其上做出的選擇將是最常見的手機解決方案。目標是通過基於用戶選擇的智能學習自動生成手機壁紙。

+0

你希望實現和呈現的結果是什麼? 5個機頂盒區域,彩色「熱點」區域還是其他? –

+0

實際的圖像分辨率會高得多,我希望能夠自動爲使用用戶輸入的手機生成壁紙。 – Suyash

+0

如果2個角落同樣受歡迎的選擇區域,您會喜歡什麼結果?採取其中一個角落或他們之間的區域? –

回答

2

我相信你有上面標識2個不同的問題:

ONE:鑑定點

對於這一點,你需要開發某種啓發式的識別是否點應被考慮與否。

我相信你提到過成百上千的用戶將成爲這個圖像的選擇位置?數百個可能是很多要集羣的點。考慮排除異常值(通過刪除在特定距離內沒有特定數量鄰居的點)

任何可以減少數據集的操作都將有所幫助。


二:點

我相信,K均值聚類是最適合這一特定問題的羣集。 LINK

您的特定問題似乎與用於解釋此算法的標準笛卡爾座標聚類示例非常相似。

你想要做的似乎是NP-Hard,但應該通過古典近似來滿足。

聚類之後,您可以對該聚類中的點進行平均,以獲得相當準確的近似值。

另外:

您的數據集聽起來就已經被緊密集羣。 (即大多數人會選擇狗的臉,而不是軀幹的一側)。您需要了解當地的最低標準。 LINK這些確實會讓你的算法陷入困境。尤其是少數幾個羣集。請注意,您可能需要一些動態編程來解決這個問題。通常可以在算法中引入一些方差,從而允許平均點「跳出」這些局部最小值。 Local Minima/Maxima

希望這有助於!

+0

在我可以實現這個功能之前,我將不得不做很多的學習工作,但是我非常想的,還有更多! – Suyash

+0

哈哈,我知道你的意思。我是一名主修機器人工程和計算機科學的學生,專注於人工智能。所以,如果你有50萬美元的年份,我會在學校給你一個好消息 – Peaches491

+1

大聲笑..如果我有50萬美元的年份,我不會問這個問題,會聘請一個現在團隊..:P – Suyash

2

我想你可能會以不同的方式來處理你的問題。如果您還沒有聽說過Seam Carving,那麼我建議您檢查一下,因爲您可以使用的數據非常適合它。這個想法是,而不是裁剪一個圖像來調整它的大小,而是可以刪除不一定在一條直線上的像素路徑。這允許您在保留更多「有趣」信息的同時調整圖像大小。

通常你選擇能量最少的路徑,這裏的能量是沿路徑上色調/強度變化的一些度量。當你有一個非常重要的圖像區域(如狗的臉)時,這將失敗,但這些區域的能量不一定非常高。由於您有用戶數據指示圖像的哪些部分非常重要,因此每次有人選擇具有該像素的區域時,都可以通過向像素明確添加一點能量來確保在圖像的這些區域周圍雕刻。

This video顯示接縫雕刻的行動,即使你不認爲你會使用它,看起來很酷。不過,我認爲這值得嘗試,但之前我已經使用它來進行一些有趣的調整大小的應用程序,而且實現起來非常簡單。

+0

非常非常有趣!然而,大多數圖像將包含主要面孔和人類,這種調整會扭曲他們的臉。但肯定適用於我想到的更多東西!非常感謝! – Suyash

+0

@Suyasha:但這就是爲什麼你的情況如此之好,如果你有人類告訴你圖像的哪些區域是重要的,那麼你可以避免這個問題。 –

+0

我會在圖像上運行一些測試,如果它的工作,那麼真棒!我目前正在查找它的PHP實現,但沒有發現任何使用.. – Suyash