2

我正在使用bag-of-words模型對醫學圖像進行分類。 我做了以下來提取特徵向量:從小圖像塊分類詞語包 - 特徵vs像素

  1. 提取特徵,然後在 申請BOW這些功能由小圖像塊
  2. 提取像素值,然後在這些像素應用BOW值

特徵提取後,我嘗試PCA,功能選擇,改變KMeans等的集羣的數量,以提高準確性。但在我的案例中,BOW學習的像素值(1)優於(2)(70%)的特徵(2)學習的BOW。我的功能非常好,當我使用這些功能對圖像進行分類時,我可以獲得95%以上的準確性。

我的問題是爲什麼BOW學習像素比BOW學習功能表現更好?

enter image description here enter image description here

正常,不正常的結腸鏡圖像分類

Figure 1: a normal colon image 
    Figure 2: an image with polyp 
+0

如果可能,你能展示一些圖片,並告訴你正在嘗試識別哪些類別? – Maurits

+0

這是一個正常與異常結腸鏡檢查圖像分類。 – user570593

+2

對不起,但我不知道那會是什麼樣子.. – Maurits

回答

3

我你的兩種方法從圖像塊中提取特徵的理解是

特徵選擇=「運行PCA,K - 平均值或選擇一些像素子集,並構建這些提取值的向量「

像素值=「從圖像的RGB值創建矢量」

實際上,爲了從BOW特徵中獲得良好的效果,人們通常會使用相對複雜的算法推導出各個特徵。

在項目http://vision.stanford.edu/projects/totalscene/index.html(參考文獻#1)中,作者從兩個圖像塊和分割中獲取BOW特徵。對於圖像塊,他們提取SIFT特徵,並且爲他們形成的每個片段,顏色,位置和紋理特徵(請參見2.1節,並按照參考以更好地描述它們使用的特徵)。

在「將場景分解爲幾何和語義一致的區域」。 (Gould等)形狀,顏色,邊緣等特徵是通過訓練推動邏輯迴歸分類器,Potts模型和高斯混合模型等方法得到的。

您可能不需要如此密集的技術來提取擊敗像素向量的特徵,但您應該瀏覽文獻以瞭解什麼是有效的。

SIFT特徵,顏色直方圖和過濾器提取紋理響應似乎工作得很好,並且還具有合理數量的軟件庫支持。

+0

謝謝你的信息。我試過2:(1)提取特徵(紋理,顏色,邊緣等)(2)只有顏色。提取特徵後,我嘗試了提取的特徵/強度值上的PCA /特徵選擇。我在一些論文中發現,對於具有幾百個簇的強度值而言,就足夠了,但對於特徵我們應該有數千個簇。所以目前我正在嘗試很多集羣,並希望它能給我帶來好的結果。我會盡快更新結果。 – user570593