我正在測試Aspose.OCR,試圖OCR一個簡單的文檔,但發現OcrEngine.Process()返回與我的示例文檔和Aspose提供的示例的jibberish。Aspose.OCR無法讀取簡單的JPEG文件
我的代碼:
var license = new License();
license.SetLicense("Aspose.OCR.lic");
OcrEngine ocrEngine = new OcrEngine();
string text = null;
ocrEngine.Image = ImageStream.FromFile("Sample.Aspose.jpg");
if (ocrEngine.Process())
{
text = ocrEngine.Text.ToString();
}
Assert.IsTrue(text.Contains("TRUTH"), text);
的Sample.Aspose.jpg是Aspose's GIT sample副本。
文本返回(截斷爲簡潔起見)的開頭是:
阿維[hhhBuyahLITITI的L1重組人 - - ] --- HHH --III-F LIII-FHH LT} ITIř F8 4 1 TYL h IiR
lm
'kpfan order 081Dec - - hh - hh - - h - h j : t ITI lblel tljehrerlly }}ollnatffst/t trun IT IT } li III
ckaigf nigh''I ..}::;;。et}: fc.'IL:ef:t ;; e; atc {1';;;:L IT':c: ,...,...,..., ''我
從sample GIF返回等價的亂碼。
我是否缺少OcrEngine的一些簡單設置?
看起來我的測試是使用構成Aspose OCR引擎的「邊界條件」的圖像。引擎運行正常,圖像正常,但我的用例傾向於邊界條件。 Google的Cloud Vision API在識別本文中引用的圖像方面做了不錯的工作。 –