2009-02-02 348 views
3

我需要一個能檢測圖像中物體的庫(使用邊緣檢測)。這與驗證碼無關。我正在研究一款使用OCR的MTGO機器人,它可以在任何屏幕分辨率下工作。爲了能夠移植到任何屏幕分辨率,我的想法是掃描結果頁面上的窄範圍(玩家擁有的卡片可以列在文本行中)並查找該範圍內的每個對象。然後獲取每個對象的最低和最高像素座標,以查找行開始和結束的位置(在y軸上),以便我可以使用OCR讀取每一行。C++的圖像處理庫

回答

4

如果你不知道OpenCV例子的集合,那麼它們可以幫助你在正確的方向......還有Camellia它不使用「邊緣檢測」,但可以得到你的結果需要一點工作。

+0

似乎無法找到任何相關示例。有沒有一些你特別想到的,可以指向我?謝謝。 – Zombies 2009-02-09 20:26:02

0

tesseract-ocr? (Apache許可證2.0)

+0

是的,我打算明確使用tesseract-OCR,以及OCR部分。我需要一種方法來掃描圖像並查找對象,然後將它們拼接成段供OCR讀取。 – Zombies 2009-02-03 15:19:49

2

它並不便宜,但我使用了英特爾處理基元,並且對它們的性能印象非常深刻。他們在Intel和AMD處理器以及Windows和Linux上工作。

+1

這並不算太糟糕 - 它的授權是300美元。我在工作中使用IPP,對此非常滿意。 – 2009-02-02 21:32:20

1

也許這將是有益的:

Simd Library是一個免費開源的圖像處理庫,專爲C和C++程序員。它爲圖像處理提供了許多有用的高性能算法,如像素格式轉換,圖像縮放和過濾,從圖像中提取統計信息,運動檢測。算法使用不同的SIMD CPU擴展進行了優化。特別是該庫支持以下CPU擴展:用於x86/x64的SSE,SSE2,SSSE3,SSE4.1,SSE4.2,AVX和AVX2,用於PowerPC的VMX(Altivec)和VSX(Power7),用於ARM的NEON。 Simd庫具有C API,並且還包含有用的C++類和函數,以便於訪問C API。該庫支持動態和靜態鏈接,32位和64位Windows和Linux,MSVS和G ++編譯器,MSVS項目和CMake構建系統。