2014-12-01 95 views
3

我想寫一個應用程序(最初是Windows),其中包括手寫到文本識別。我想使用Windows內置的Tablet PC輸入。我的問題是,有沒有一種方法可以將圖像捕捉爲圖像,「將這些圖像發送到平板電腦輸入使用的OCR引擎,並返回識別的文本?使用Windows平板電腦輸入來實現手寫識別

或者,有沒有什麼好的開源手寫庫可以可以直接使用?

主要開發語言是Qt的。

+1

根據這一研究使我對如何做到這一點在C#.. http://www.codemag.com/Article/0704112這篇大文章。想知道如何在Qt/C++應用程序中使用它。 – TenG 2014-12-09 15:10:52

+1

tesseract + opencv是您的出發點。請記住,沒有100%手寫的ocr技術可用。您可能需要爲您的語言使用詞典數據庫(例如Google翻譯使用)來猜測包含最少信息的詞語。 – baci 2015-02-08 03:22:21

回答

0

我想是錯的,但不幸的是,沒有可用的開源脫機手寫識別系統甚至接近MS」或蘋果公司的油墨。

在Windows上,您可以玩Ink Recognition(About Handwriting RecognitionAdvanced Recognition Sample)。 C++接口是可用的,但沒有像.net實現那樣記錄良好。所以,你需要付出更多的努力並做大量的研究來實現你想要的。

對於另一個系統(包括Windows),可以在您的應用程序中使用Tesseract-OCR。見Tesseract's base api。爲了獲得更好的識別質量,您可以使用您自己的訓練數據。

如果你不想花時間做如上文中R & d任務,您可以使用支付解決方案,如:MyScript SDKWritePad SDK等等...

1

我不知道任何開源或免費的用於手寫識別的軟件庫,所以我寫了一個適配器。我的目標是運行Linux的平板電腦,但我的解決方案的一部分也可以直接在Windows上使用,但您需要根據自己的需要進行調整。

您需要仔細閱讀我使用的組件的許可證並驗證您自己使用它們的組件。

源可以在這裏找到:這個解決方案的Ink2Text project

部分原因是它使用XP手寫識別庫,以解釋其彌補手寫筆畫的服務器。順便說一句,這不使用OCR - 它使用筆劃流的連接圖。

另一個補充項目提供了一個客戶端手寫小部件:Stylus/Handwriting Input Panel。這是用Java編寫的,它是GPL3。它接受手寫並將其發送到服務器。除非您希望按原樣使用它,否則只有看到墨水的數據格式纔是有價值的,儘管這很簡單,您可以使用Ink2Text源代碼來推斷。

早期的解決方案使用S/HIP和我的MS Ink Server,它接受通過常規網絡連接的輸入。根據您的體系結構,這也可能有用,但需要運行Windows副本。

該系統提供了非常好的印刷和草書手寫識別。

我只會在相關的SourceForge論壇上回答有關它的問題,以便其他人可以從答案中獲益 - 請不要在這裏問。

乾杯, 佈雷特