我工作在C#應用程序中。 應用程序從視頻設備抓取圖像(電視/相機或輸入視頻文件)。 然後處理它並將其保存在文本文檔中。如何創建視頻OCR?
我的問題是,「如何創建數字視頻OCR?」
請給我任何教程/鏈接/源代碼。
我工作在C#應用程序中。 應用程序從視頻設備抓取圖像(電視/相機或輸入視頻文件)。 然後處理它並將其保存在文本文檔中。如何創建視頻OCR?
我的問題是,「如何創建數字視頻OCR?」
請給我任何教程/鏈接/源代碼。
從OCR部分的tesseract-ocr .net engine開始,爲相機方法開始Emgu CV。祝你好運。
由於視頻OCR仍然是一個活躍的研究課題,您可能需要付出更多的努力來開發自己的視頻OCR引擎。基本上,可以基於視頻場景切換檢測,視頻切割中的文本檢測和識別來構建視頻OCR框架。使用場景剪切檢測作爲預處理步驟來降低計算成本;然後定位視頻剪切幀中的文本內容的位置和邊界;通過使用適當的文本分割和二值化技術從背景分離文本像素;最後可以應用打印OCR引擎來獲得文本結果。如果你只處理少量的視頻數據,你可以在mashape上使用free video OCR rest API。
如果您或其他人正在處理此問題,我發現this site會非常有幫助。
基本上,視頻轉換爲靜止圖像,處理這些圖像以優化OCR結果,然後每個圖像都被OCR處理。