2017-05-08 77 views
1

我的需求是我需要使用張量流從圖像(jpg)中讀取OCR文本。 我嘗試通過下載下面的項目並嘗試執行代碼。張量流中的ocr實現

https://github.com/tensorflow/models/tree/master/attention_ocr

我能夠執行train.py但無法測試的完整流程。我想訓練和測試100個樣本圖像。任何人都可以分享如何進一步深入細節。

僅供參考: 早些時候我使用pytesser API,但準確度非常低。它無法閱讀各種尺寸的文字。

回答

1

要在FSNS數據集運行

python eval.py --dataset_name=fsns --split_name=test 

它將運行爲--num_batches評價(默認100)倍--batch_size圖像(默認32)測試的模型。

如果你想測試它在您自己的數據,你有三種選擇:

  1. 將它轉換成same format as FSNS和重用fsns.py
  2. 不要轉換的數據定義mynewdatasetname.py,但寫類似fsns.py一個自定義的數據集文件(見get_split功能
  3. 編寫自定義腳本來export訓練的模型和一個自定義腳本的eval /應用做了評價。這裏有some tips for that

請注意,FSNS培訓的Attention OCR模型將能夠在法國抄錄街道名稱標誌,而不僅僅是隨機文本。