2014-02-11 89 views
0

我開始爲學校開發一個新項目,並且想知道是否有任何資源可用。我在一些開放源代碼的OCR項目中涉獵了一些,發現Tesseract是更準確的一個(但仍然有些混亂)。有沒有人有一個想法,我可以開始,或者如果他們可以推動我與Tesseract或任何其他圖書館/例子正確的方向。Mobotix IP攝像機的OCR庫

將相機放在帶有序列號的容器上。需要通過圖片(實時數據流的屏幕截圖)識別序列號(字符和數字,不同顏色的粗體白色),然後在數據庫中查找序列號以獲取所需的信息。我很感激任何向正確的方向推動。

該語言最好在Java/C++中,因爲我只有這兩種編程語言的經驗,所以如果我可以使用這兩種語言中的任何一種,它都會使我更容易開始。

回答

0

攝像機被放置在帶有序列號的容器上。

我認爲這意味着您將使用的圖像將總是具有相同的尺寸,或多或少。如果不是,則可能必須操作圖像,以便覆蓋序列的區域在圖像之間變化不大。

將相機放置在帶有序列號的容器上。 序列號(字符和數字,不同顏色的大膽白色)

您是否正在對圖像進行任何預處理?像例如採取任何非白色像素,並把它變成黑色?這將使您的OCR不依賴於圖像顏色,從而增加其靈活性。

裁剪要發送到OCR的圖像,使其僅包含要解碼的數字,還應該改進OCR的功能。

如果這仍然不適合您,您可以嘗試並訓練您的Tesseract網絡,如here所示。