謝謝你看我的問題。排序非常相似的圖片PHP OCR
基本上我想要做的就是找到像第一和這裏的第三圖像的所有圖像:http://imgur.com/a/IhHEC
,並刪除所有不喜歡看的是(2,4)中的那些。
我試過幾個庫都無濟於事。
另一個可接受的方法是檢查圖像是否包含「Code:」,因爲該字符串位於每個我必須分類的字符串中。
謝謝你,史蒂夫
編輯:雖然第一和第三圖像看起來他們是相同的大小,他們不是。
謝謝你看我的問題。排序非常相似的圖片PHP OCR
基本上我想要做的就是找到像第一和這裏的第三圖像的所有圖像:http://imgur.com/a/IhHEC
,並刪除所有不喜歡看的是(2,4)中的那些。
我試過幾個庫都無濟於事。
另一個可接受的方法是檢查圖像是否包含「Code:」,因爲該字符串位於每個我必須分類的字符串中。
謝謝你,史蒂夫
編輯:雖然第一和第三圖像看起來他們是相同的大小,他們不是。
如果這些是您要使用的實際圖像,它看起來像直方圖相似性可以完成這項工作。第一和第三是非常不同的,第二和第四,尤其是第四,有不同的強度。
您可以輕鬆製作圖像中灰度陰影的直方圖,然後將閾值應用於直方圖的形狀以對它們進行分類。
編輯:要實際做到這一點:您可以遍歷每個像素,並創建一個像素值的數組=>>找到的次數。因爲它是灰度,你可以選擇R,G或B頻道。然後將每個數字除以圖像中的像素數量進行歸一化,以便它適用於任何尺寸。直方圖中的每個條目將是所用像素數的一小部分。然後,您可以測量高於某個閾值的數值。如果有很多灰色,你會得到大量的小值。如果沒有,你會得到少量的大數值。
由於我的工作背景是使用圖像中的文字而不是圖像對象,因此我會在後OCR處理中通過搜索文本內容中的「關鍵字」或檢查代表所需數據的「正則表達式」。這意味着整個工作需要分爲兩個階段:圖像到文本OCR(免費或便宜,軟件或雲)和實際分離過程(簡單編程)。
你試過了哪些庫,究竟是如何失敗的?否則,人們可能會再次推薦相同的解決方案 –
我試過http://sourceforge.net/projects/phpocr/ 和http://www.phpclasses.org/package/2874-PHP-Recognize-text- objects-in-graphical-images.html 由於第二個只能識別一個圖像中的一個字母,並且第一個根本不識別(對於「代碼:XXXX-XXXX-XXXX- XXXX「它輸出」8「。) – Steve