2011-03-05 25 views
0

我的文檔OCR工作在圖像上,當頁面上有「咖啡」或「432」等字樣時工作正常,但當我嘗試OCR一個字詞「abc123」時,我得到一個「OCR Running錯誤」。您可以使用MODI OCR識別非語言特定的項目嗎?

MODI.Document md = new MODI.Document(); 

md.Create("c:\\temp\\mpk.tiff"); 

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true); // <-- Error thrown here 
MODI.Image image = (MODI.Image)md.Images[0]; 

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew); 

StreamWriter writeFile = new StreamWriter(createFile); 
writeFile.Write(image.Layout.Text); 
writeFile.Close(); 

md.Close(); 

當然MS沒有建立這個庫認識爲基礎的語言的話嗎?還是他們?我是否缺少MODI.document設置?

任何幫助,將不勝感激,

回答

2

是的,他們做到了。如果沒有相關的字典和片段,OCR會變得非常不準確。人類也是如此:ABC123,ABCI23,ABCl23。三種不同的字符串這在實踐中通過使用特殊字體來解決,這些字體可以最大限度地減少字母和數字不明確的可能性,這在銀行支票上看到的那種。

+0

這真的很不幸,很有意義,但我寧願猜猜每個字母也不要拋出異常。 – 2011-03-06 00:35:02

相關問題