ocr

    -1熱度

    1回答

    我需要一個定製的想法來檢測圖像中的字幕。也許一些圖像處理步驟能夠正確地從處理後的圖像中提取(例如tesseract)字符。

    0熱度

    1回答

    我試用了ocr服務。有些文字比「正常」(帶有不尋常字體的標識)更好,一些文字根本不能識別(有些區域是非白色背景)。 有什麼我可以做的,以提高認識? 感謝 馬丁

    0熱度

    1回答

    如何在Java中從圖像(如銀行表單圖像)中提取手寫文本? 我試圖使用Tesseract,OCR,GOCR,但沒有爲我工作。有沒有其他方法可以從Java中的圖像中提取手寫文本,其中至少有80-90%的效果?

    0熱度

    1回答

    我需要構建一個掃描護照的OCR應用程序,因此我選擇了tesseract作爲開始。從我讀過的應該有一個我定義的.uzn文件,但我找不到任何文檔。我怎樣才能創建這樣的模板tesseract使用。

    0熱度

    1回答

    我已經做了大量的搜索,但找不到我想要做的任何示例。 根據這篇MS文章,Windows 10內置了使用通用Windows平臺的OCR。 https://docs.microsoft.com/en-us/uwp/api/windows.media.ocr.ocrengine 任何人都知道,如果這個API可以直接通過VBA來叫什麼名字? (如何使用Visual Studio做這些事情的例子,但這不是我所

    0熱度

    1回答

    我需要從python遊戲窗口中截取的截圖中提取文本。到目前爲止,我一直在使用tesseract(pytesseract),但雖然識別本身很好,但性能並不理想。 正如我所讀到的,tesseract最適用於高分辨率的圖像,我想知道是否有更好的(更快)的方式?

    0熱度

    1回答

    如果我們假設我們有一組字體文件,並且所有字體文件都是針對相同字體的,但其中每個字體都是針對不同樣式的,例如,如果我們有字體「test」會有用於測試的常規文件,用於測試粗體的文件和用於測試斜體的文件,但是所有這些文件或樣式都具有相同的字體名稱,即「測試」,如果我將它們全部安裝在機器上,並創建單個LSTM文件進行字體測試時,tesseract是否會爲所有樣式或這些樣式中的一種創建LSTM文件。 記住我

    -1熱度

    2回答

    我一直在做一些圖像上的OCR,這些圖像是不同文檔的一部分,他們在底部有頁碼。我已經想出了一種方法來查找每個文檔,但圖像不是按順序排列的,我想按照他們的頁碼。一個打嗝是,有在頁碼的格式變化即 Page 1 of 35 Page 1-35 Page 35 加上Page可以在小寫page也。我正在尋找的是使用正則表達式從頁面中提取此類的通用方法。如果可以在一個正則表達式中處理它將會很好,因爲編譯後的版本

    1熱度

    1回答

    我想OCR很多文件(我的意思是在一天300k +範圍內)。目前我正在使用Tesseract wrapper for .NET,它的質量都很好,但速度不夠好。我平均每次掃描平均掃描半頁的20個任務的平均時間爲2546秒。使用代碼IM: using (var engine = new TesseractEngine(Tessdata, "eng", EngineMode.TesseractOnly))

    0熱度

    1回答

    我對通過在C++ API中調用AllWordConfidences()函數可以獲得的Tesseract OCR置信度值有一些疑問。 什麼是置信值(由正方體API返回)和如何正方體計算價值?(喜歡根據什麼因素)? 有沒有可能改變tesseract的準確度? 任何人都可以幫助我解決這些問題嗎?謝謝。