2015-11-19 47 views

回答

0

如果您使用的是不具有專用的自動旋轉功能,OCR技術(大部分做的,所以仔細檢查),然後我用的方法是檢查是否有任何字符置信度或檢查用於詞典中的單詞。例如,ABBYY OCR具有專用的自動旋轉設置。 OCR-IT API也具有自動旋轉功能,並且還可以返回XML結果中的標誌,例如IsWordFromDictionary。每種OCR技術的工作可能不同。

如果您預計只有4個可能的旋轉,則算法爲:

  1. 執行OCR。檢查信心,或字典的單詞,甚至只是大寫(不正確的旋轉會產生像這樣的混亂:DioOpUllltG)。設置接受結果的閾值,例如50%。您希望您的第一個OCR通行證來自正確方向的圖像(統計方法)。
  2. 如果質量低於您的閾值,那麼您的圖像質量不佳或方向錯誤。旋轉並檢查剩餘的三個方向。選擇最好的一個。

在某些項目中,圖像可能處於不可預知的極端角度(如30度),因此執行4次翻轉時,OCR在每種情況下都會失敗。然後,我通常每10度旋轉一次使用OCR傳球(36次OCR傳球),並選擇最佳情況。

+0

建議無誤。一個可行的解決方案。我認爲我嘗試了4種不同的狀態,然後我嘗試。但OCR過程的高成本並不快(Tesseract OCR不夠快)。時間也在增長。 –