有沒有什麼辦法可以從jpg jpeg或其他格式的掃描文檔中獲取文本?我使用Ruby作爲我的編程語言。但是,我猜如果能從其他編程語言的幫助下獲得文本,集成起來不會有太大問題。從掃描圖像中讀取文本文件
謝謝。
有沒有什麼辦法可以從jpg jpeg或其他格式的掃描文檔中獲取文本?我使用Ruby作爲我的編程語言。但是,我猜如果能從其他編程語言的幫助下獲得文本,集成起來不會有太大問題。從掃描圖像中讀取文本文件
謝謝。
是的,您可以使用OCR庫。在https://stackoverflow.com/questions/1085/free-ocr-library有更多的細節。
簡而言之,您不妨考慮使用tessnet(http://www.pixel-technology.com/freeware/tessnet2/)。
這項技術被稱爲光學字符識別(OCR)。
對於編程,check out this question,其中推薦tesseract-ocr。
OCR for ruby? check out this question。
如果它只是一對夫婦的圖像,here's a site that supposedly does it for free。
OCR終端http://www.ocrterminal.com一直是我用過的至少一打的最好的(最準確的)免費工具。它對格式化(表格)數據效果特別好。
這是在線工作。您不能將其用作程序的嵌入式部分。 – sawa 2011-04-06 13:01:15
wiki OCR,http://en.wikipedia.org/wiki/OCR – 2011-03-25 04:52:58