2013-02-28 45 views
0

我一直在嘗試學習圖像大小調整算法,如最近鄰居,雙立方和雙線性插值算法。我已經研究了一下數學,現在我正在研究現有的實現來理解和欣賞它們的工作方式。雙立方圖像調整大小算法

我開始與雙三次調整大小我在谷歌的代碼,它使用了OpenCV發現this implementation,並提供測試和示例代碼。我用它作爲一個起點,我自己的實現,不使用OpenCV的,但只是對包含在std::vector<unsigned char>原始的位圖操作:

std::vector<unsigned char> bicubicresize(const std::vector<unsigned char>& in, std::size_t src_width, 
    std::size_t src_height, std::size_t dest_width, std::size_t dest_height) 
{ 
    std::vector<unsigned char> out(dest_width * dest_height * 3); 

    const float tx = float(src_width)/dest_width; 
    const float ty = float(src_height)/dest_height; 
    const int components = 3; 
    const int bytes_per_row = src_width * components; 

    const int components2 = components; 
    const int bytes_per_row2 = dest_width * components; 

    int a, b, c, d, index; 
    unsigned char Ca, Cb, Cc; 
    unsigned char C[5]; 
    unsigned char d0, d2, d3, a0, a1, a2, a3; 

    for (int i = 0; i < dest_height; ++i) 
    { 
     for (int j = 0; j < dest_width; ++j) 
     { 
      const int x = int(tx * j); 
      const int y = int(ty * i); 
      const float dx = tx * j - x; 
      const float dy = ty * i - y; 

      index = y * bytes_per_row + x * components; 
      a = y * bytes_per_row + (x + 1) * components; 
      b = (y + 1) * bytes_per_row + x * components; 
      c = (y + 1) * bytes_per_row + (x + 1) * components; 

      for (int k = 0; k < 3; ++k) 
      { 
       for (int jj = 0; jj <= 3; ++jj) 
       { 
        d0 = in[(y - 1 + jj) * bytes_per_row + (x - 1) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k]; 
        d2 = in[(y - 1 + jj) * bytes_per_row + (x + 1) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k]; 
        d3 = in[(y - 1 + jj) * bytes_per_row + (x + 2) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k]; 
        a0 = in[(y - 1 + jj) * bytes_per_row + (x) * components + k]; 
        a1 = -1.0/3 * d0 + d2 - 1.0/6 * d3; 
        a2 = 1.0/2 * d0 + 1.0/2 * d2; 
        a3 = -1.0/6 * d0 - 1.0/2 * d2 + 1.0/6 * d3; 
        C[jj] = a0 + a1 * dx + a2 * dx * dx + a3 * dx * dx * dx; 

        d0 = C[0] - C[1]; 
        d2 = C[2] - C[1]; 
        d3 = C[3] - C[1]; 
        a0 = C[1]; 
        a1 = -1.0/3 * d0 + d2 -1.0/6 * d3; 
        a2 = 1.0/2 * d0 + 1.0/2 * d2; 
        a3 = -1.0/6 * d0 - 1.0/2 * d2 + 1.0/6 * d3; 
        Cc = a0 + a1 * dy + a2 * dy * dy + a3* dy * dy * dy; 
        out[i * bytes_per_row2 + j * components2 + k] = Cc; 
       } 
      } 
     } 
    } 

    return out; 
} 



現在,就我所看到的,這個實現致命的缺陷,因爲該行的:

d0 = in[(y - 1 + jj) * bytes_per_row + (x - 1) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k]; 



它看起來像我這樣的行總是y0訪問超出界限的數組索引。並且y最初始終爲0,因爲y使用y = ty * i進行初始化,並且i是一個迭代器變量,其起始於0。因此,因爲y將始終在0開始,所以表達式(y - 1 + jj) * bytes_per_row + (x - 1) * components + k(用於計算ARRAY INDEX)將始終爲負值。而且......顯然,負數組索引無效。

問題:它看起來像這樣的代碼無法工作的方式。不知何故我錯了嗎?

+0

對我來說,FWIW,你的觀察似乎是正確的。 – 2013-02-28 17:40:00

回答

2

一種方式做到這一點是定義一個GetPixel()函數:

GetPixel(int x, int y, int channel) 
{ 
    if (x >= 0 && x <= width-1) 
     if (y >=0 && y <= height-1) 
     return QueriedPixelFromImage(x,y,channel); 
    return 0; // out of bounds 
} 

你將取代

d0 = in[(y - 1 + jj) * bytes_per_row + (x - 1) * components + k] 

通過

d0 = GetPixel(x-1,y-1+jj,k) 
1

我進行了一些測試代碼,以確保我不會錯過任何東西,但據我可以看到你確實是正確的:

#include <iostream> 

int main() 
{ 

    int components = 3; 

    const float tx = 200/50; 
    const float ty = 200/50 ; 
    int bytes_per_row = 1000 ; 

    for (int i = 0; i < 5; ++i) 
    { 
    for (int j = 0; j < 5; ++j) 
    { 
     const int x = int(tx * j); 
     const int y = int(ty * i); 

     for (int k = 0; k < 3; ++k) 
     { 
      for (int jj = 0; jj <= 3; ++jj) 
      { 
       std::cout << "calc: " << (y - 1 + jj) * bytes_per_row + (x - 1) * components + k << std::endl ; 
      } 
     } 
    } 
    } 
} 

我看了一下代碼,你所提供的網站,它的看起來不是一個非常大的項目。所以也許你應該聯繫項目維護人員,看看他們能否提供一些幫助。有一個聯繫人的電子郵件在頭版http://code.google.com/a/eclipselabs.org/p/bicubic-interpolation-image-processing/