2016-09-19 57 views
0

現在我使用一些神經網絡進行OCR,它會產生輸出符號和一些概率。另外我有算法來分割觸摸字符。神經網絡OCR - 使用概率來確定觸摸符號?

我希望用概率來決定何時應用拆分。 但現在我不能這樣做,因爲我的網絡有時會提供接觸字符的概率高於普通字符的概率。

而且我不明白髮生了什麼事,甚至分裂之後 - 有時正常符號可以被分成兩個另一個符號既可以以更高的概率初始符號識別。

所以我需要決定做什麼。問題是 神經網絡至少在理論上可以爲這種意義上的OCR提供可靠的概率嗎? 如果可能的話,我應該怎麼做?我應該嘗試處理當前輸出還是訓練更多網絡或選擇另一個網絡?

任何形式的幫助或建議將不勝感激

回答

0

你的做法是很好的,最終應該工作給予足夠的訓練數據和給您從預處理,分割,刪除訓練不夠臭蟲等

確保您在訓練集(在訓練之前)分割完全一樣的方式,當您測試他們時分裂數字。

但是請注意,機器學習產生一定的精度範圍內是正確的算法,所以你總能找到失敗的實例。問題在於您的總體測試性能(例如%正確的數字)有多好,以及如何將其提高到您的應用程序所需的水平。

問題是神經網絡至少在理論上是否可以爲這種意義上的OCR提供可靠的 ?

如果可能的話那麼我應該嘗試做?我應該嘗試 處理當前輸出還是訓練網絡更多或選擇另一個 網絡?

上述所有的,直到它的作品!培訓規模是關鍵因素之一,隨着培訓規模的增長,您可以增加網絡以提高準確性。

+0

現狀是,神經網絡給出了0.99的概率一些組合,喜歡它認爲,觸摸「FL」是「N」的概率爲0.994786739 – Aleksey