2015-04-21 70 views
7

我想檢測顯微鏡圖像單元格內的對象。我有很多帶註釋的圖像(應用程序50.000圖像與對象和500.000沒有對象)。圖像中的對象檢測(HOG)

到目前爲止,我嘗試使用HOG提取特徵並使用邏輯迴歸和LinearSVC進行分類。我已經嘗試了HOG或色彩空間(RGB,HSV,LAB)的幾個參數,但我沒有看到很大的差異,預測率大約爲70%。

我有幾個問題。我應該使用多少圖片來訓練描述符?我應該使用多少圖片來測試預測?

我已經嘗試過大約1000張訓練圖像,這給我55%的積極和5000,這給我72%的積極。但是,這也取決於測試集,有時測試集可以達到80-90%的正檢測圖像。

下面是包含一個對象的兩個例子和兩個圖像沒有對象:

object 01

object 02

cell 01

cell 02

的另一個問題是,有時圖像包含幾個對象:

objects

我應該嘗試增加學習集的示例嗎?我應該如何選擇訓練集的圖像,只是隨機?我還能嘗試什麼?

任何幫助將非常感激,我剛開始發現機器學習。我正在使用Python(scikit-image & scikit-learn)。

回答

2

我認爲你在正確的道路是,但讓我提出一些注意事項:

1 - 訓練集的數量將是分類 問題始終是重要的(通常情況下,更多的是更好)。但是,您必須具有很好的註釋 ,並且您的方法應該對異常值有效。

2 - 從您所放置的圖像中,似乎顏色直方圖 比HOG更具辨別性。當使用顏色直方圖時,我通常使用 爲Lab色彩空間和相關的a-b直方圖。 L是亮度,而且很依賴於圖像獲取(例如亮度)。用於重新識別行人的一種方法 是將圖像劃分爲 塊,並計算這些塊內的直方圖。這可以幫助 。

3 - 測試你的分類方法,最好的方法是交叉驗證: http://en.wikipedia.org/wiki/Cross-validation_%28statistics%29#k-fold_cross-validation

4 - 您是否嘗試過其他的分類?WEKA可能是 輕鬆地測試不同的方法/參數很有意思: http://www.cs.waikato.ac.nz/ml/weka/

5 - 最後,如果你仍然有壞的結果,而且不知道其中 樣的,你應該使用功能,您可以將深層神經網絡 它!

希望它有幫助。

+0

非常感謝您的建議,他們非常有幫助!我很快嘗試了LAB直方圖(也從scikit-image郵件列表中建議),看起來像使用亮度通道,我可以獲得非常好的結果,用於正確檢測對象的單元格。然而它預測對於沒有對象的單元格非常糟糕。另一方面,爲了檢測沒有物體的細胞,HOG表現得非常好。我認爲將這兩種模式結合起來可能會起作用(我不確定這是否可行)。我仍然沒有交叉驗證,所以這都是初步的。謝謝你的提示! – snowflake

+0

細胞周圍常有其他物體染黑,但不應檢測到。我認爲這就是爲什麼當使用LAB直方圖時,我會得到很多誤報,但與HOG無關。 – snowflake

+0

我還有一個問題,它看起來像垃圾桶的大小起着很大的作用。我如何選擇合適的紙盒尺寸?是否有任何規則或者像「嘗試和錯誤」? – snowflake