2012-06-14 105 views
0

在我的一個項目中,我需要將圖像轉換爲文本。 谷歌搜索後發現Tessaract可以做到這一點。但不知何故,我不能在我的應用程序中使用它。所以除了「Tessaract引擎」之外,還有其他方法可以將圖像轉換爲文本嗎? Plz幫助。如何將圖像轉換爲C中的文本#

+5

'但不知何故,我不能在我的application'使用它爲什麼不呢?你會得到什麼錯誤? – SLaks

+0

將圖像轉換爲文本是什麼意思?你的意思是你有一張圖片,例如一個字,你需要把它翻譯成文字或者你的意思是你必須把圖像的每個小區域變成一個大致對應於這樣你就可以看到一些東西,當它看起來很遠時,它看上去有點像原始圖片? – automatic

+0

鑑於提到了tessaract軟件,我敢打賭它是關於將掃描的文本頁面轉換爲完整的字符串/字符,就像掃描軟件在進行可搜索/可選PDF時進行掃描一樣。 –

回答

3

如果將圖像轉換爲二進制可以幫助,我給你的代碼。我認爲你可以轉換成base64來管理你的圖像作爲一個字符串,但它比圖像更大。

public byte[] ImageToByte(Image image, System.Drawing.Imaging.ImageFormat format){ 
      using (MemoryStream ms = new MemoryStream()) 
      { 
       // Convert Image to byte[] 
       image.Save(ms, format); 
       byte[] imageBytes = ms.ToArray(); 
       return imageBytes; 
      } 
     } 

如果你想將它轉換爲base64讓我知道。

希望它可以幫助

+2

我認爲OP需要OCR - 因爲這就是Tessaract的原因。 – weston

+0

我的要求是,如果我有一個文本寫入的bmp文件,那麼我需要獲取文本 –