ocr

我已經做了大量的搜索，但找不到我想要做的任何示例。根據這篇MS文章，Windows 10內置了使用通用Windows平臺的OCR。 https://docs.microsoft.com/en-us/uwp/api/windows.media.ocr.ocrengine 任何人都知道，如果這個API可以直接通過VBA來叫什麼名字？（如何使用Visual Studio做這些事情的例子，但這不是我所

0熱度

1回答

是否有替代（py）tesseract從遊戲截圖中提取文本？

我需要從python遊戲窗口中截取的截圖中提取文本。到目前爲止，我一直在使用tesseract（pytesseract），但雖然識別本身很好，但性能並不理想。正如我所讀到的，tesseract最適用於高分辨率的圖像，我想知道是否有更好的（更快）的方式？

0熱度

1回答

Tesseract OCR多種字體

如果我們假設我們有一組字體文件，並且所有字體文件都是針對相同字體的，但其中每個字體都是針對不同樣式的，例如，如果我們有字體「test」會有用於測試的常規文件，用於測試粗體的文件和用於測試斜體的文件，但是所有這些文件或樣式都具有相同的字體名稱，即「測試」，如果我將它們全部安裝在機器上，並創建單個LSTM文件進行字體測試時，tesseract是否會爲所有樣式或這些樣式中的一種創建LSTM文件。記住我

-1熱度

2回答

如何從文本中查找/提取頁碼？

我一直在做一些圖像上的OCR，這些圖像是不同文檔的一部分，他們在底部有頁碼。我已經想出了一種方法來查找每個文檔，但圖像不是按順序排列的，我想按照他們的頁碼。一個打嗝是，有在頁碼的格式變化即 Page 1 of 35 Page 1-35 Page 35 加上Page可以在小寫page也。我正在尋找的是使用正則表達式從頁面中提取此類的通用方法。如果可以在一個正則表達式中處理它將會很好，因爲編譯後的版本

1熱度

1回答

如何加快tesseract OCR

我想OCR很多文件（我的意思是在一天300k +範圍內）。目前我正在使用Tesseract wrapper for .NET，它的質量都很好，但速度不夠好。我平均每次掃描平均掃描半頁的20個任務的平均時間爲2546秒。使用代碼IM： using (var engine = new TesseractEngine(Tessdata, "eng", EngineMode.TesseractOnly))

0熱度

1回答

Tesseract OCR的置信度值

我對通過在C++ API中調用AllWordConfidences()函數可以獲得的Tesseract OCR置信度值有一些疑問。什麼是置信值（由正方體API返回）和如何正方體計算價值？（喜歡根據什麼因素）？有沒有可能改變tesseract的準確度？任何人都可以幫助我解決這些問題嗎？謝謝。