什麼是處理神經網絡圖像數據的更好方法？

我做了一個神經網絡，它工作正常，但我試圖用它來進行圖像識別。所以我製作了一個程序，它將圖像的每個3x3方塊取平均值，使其成爲RGB的1個元組而不是RGB的9個元組。那麼它會生成一大堆所有這些元組，所以我可以將它們饋入我的神經網絡。這裏要說的是轉換圖像轉換成可用的數據代碼：什麼是處理神經網絡圖像數據的更好方法？

from PIL import Image 

def norm(lst): 
    newtemp = [] 
    for value in lst: 
     if bool(value): 
      newtemp.append(value) 
    R = [] 
    G = [] 
    B = [] 
    for value in xrange(len(newtemp)): 
     R.append(newtemp[value][0]) 
     G.append(newtemp[value][1]) 
     B.append(newtemp[value][2]) 

    R = (sum(R)/len(R))/255. 
    G = (sum(G)/len(G))/255. 
    B = (sum(B)/len(B))/255. 

    return [R,G,B] 

def imgConverter(img): 
    im = Image.open(img) 
    im = im.convert("RGB") 
    edge = 3 
    width = im.size[0] 
    height = im.size[1] 
    pix = im.load() 
    color = [] 
    for x in xrange(0, width, edge): 
     for y in xrange(0, height, edge): 
      xmin = min(x+edge, width)-x 
      ymin = min(y+edge, height)-y 
      temp = [[] for _ in xrange(edge*edge)] 
      for xpos in xrange(0, xmin): 
       for ypos in xrange(0, ymin): 
        temp[ymin*ypos+xpos] = pix[x+xpos, y+ypos] 
      color.append(norm(temp)) 
    return color 

def datacrunching(color): 
    newdata = [] 
    for RGB in xrange(3): 
     for value in xrange(len(color)): 
      newdata.append(color[value][RGB]) 
    return newdata 

data = str(datacrunching(imgConverter("cat0.jpg"))) 
file = open("img_data.txt", "w") 
file.write(data) 
file.close()

它大大降低了數據處理，但即便如此，圖像是500×500將給lenght 83667陣列，這是相當大的。因爲數組中的每個數字都是輸入節點，所以它的速度太慢，這是我通過將每個3x3正方形分解爲1x1正方形來減少圖像數據長度的方式，這個問題或者將其送入的方式我的神經網絡？如果是我餵食的方式，我該怎麼做？有人可以幫忙，謝謝！

來源

2017-06-19 Tissuebox

您可能需要稍微閱讀一下「圖像特徵提取」（Google是您的朋友）;不能給出更多的建議，因爲這非常依賴於手頭的任務。 –

您可以使用PIL將圖像轉換爲灰度。

from PIL import Image 
image_file = Image.open("convert_image.png") # open colour image 
image_file = image_file.convert('1') # convert image to black and white

這比取平均值要快得多。

image_file現在包含圖像作爲黑白圖片。您可以將其轉換爲一個numpy矩陣，並將其存儲爲文本文件。

訓練：在前面的步驟中，應該能夠你的圖像轉換成尺寸的2D矩陣500×500。這可以被展平到尺寸的一維數組（250000，1）如果你是將其作爲輸入提供給ANN，或者如果使用CNN則可以保持2D輸入。對於圖像，首選CNNs

來源

2017-06-19 22:46:12

我想我沒有正確解釋自己，我所展示的程序工作正常，速度很快，其次是圖像2000x2000，問題是當我將數據輸入到我的神經網絡時，輸入節點變得巨大的數量太多爲我的電腦。問題更多的是我如何餵它到我的神經網絡 – Tissuebox

@Tissuebox編輯。 –

什麼是處理神經網絡圖像數據的更好方法？

回答

相關問題