2017-08-28 67 views
0

我正在測試Aspose.OCR,試圖OCR一個簡單的文檔,但發現OcrEngine.Process()返回與我的示例文檔和Aspose提供的示例的jibberish。Aspose.OCR無法讀取簡單的JPEG文件

我的代碼:

var license = new License(); 
license.SetLicense("Aspose.OCR.lic"); 
OcrEngine ocrEngine = new OcrEngine(); 
string text = null; 
ocrEngine.Image = ImageStream.FromFile("Sample.Aspose.jpg"); 
if (ocrEngine.Process()) 
{ 
    text = ocrEngine.Text.ToString(); 
} 
Assert.IsTrue(text.Contains("TRUTH"), text); 

的Sample.Aspose.jpg是Aspose's GIT sample副本。

文本返回(截斷爲簡潔起見)的開頭是:

阿維[hhhBuyahLITITI的L1重組人 - - ] --- HHH --III-F LIII-FHH LT} ITIř F8 4 1 TYL h IiR lm'k pfan order 081Dec - - hh - hh - - h - h j : t ITI lblel tljehrerlly }}ollnatffst/t trun IT IT } li III ckaigf nigh''I ..}::;;。et}: fc.'IL:ef:t ;; e; atc {1';;;:L IT':c: ,...,...,..., ''我

sample GIF返回等價的亂碼。

我是否缺少OcrEngine的一些簡單設置?

+0

看起來我的測試是使用構成Aspose OCR引擎的「邊界條件」的圖像。引擎運行正常,圖像正常,但我的用例傾向於邊界條件。 Google的Cloud Vision API在識別本文中引用的圖像方面做了不錯的工作。 –

回答

0

您使用的示例文件是OMR操作的示例。對於OCR示例,您可以考慮文件「Sample.bmp」。代碼片段很好。它會工作。

我使用Aspose作爲開發人員的傳道者。

+0

謝謝;示例bmp文件工作正常。但是,從簡單的PDF中取得的[sample gif](https://github.com/quandis/developer.quandis.net/blob/master/Sample.Disclosure.gif)將返回所有亂碼(0個真正的英文單詞)。你能提出我的問題是什麼嗎? –

+0

您共享的圖像被壓縮並具有較低的DPI。問題原因可能是所提供圖像的分辨率。 請注意,Aspose.OCR API的當前實現對於分辨率至少爲300 DPI的圖像表現良好,並且準確率趨於通過降低分辨率而降低。 –