該問題與傳統手寫識別有點不同。我有一個數據集是成千上萬的以下。對於一個繪製的角色,我有幾個順序的(x, y)
座標,筆被按下。所以,這是一個連續的(時間)問題。如何將HMM用於手寫識別?
我希望能夠根據這些數據對手寫字符進行分類,並且很樂意實現用於學習目的的HMM。但是,這是正確的方法嗎?他們如何被用來做到這一點?
該問題與傳統手寫識別有點不同。我有一個數據集是成千上萬的以下。對於一個繪製的角色,我有幾個順序的(x, y)
座標,筆被按下。所以,這是一個連續的(時間)問題。如何將HMM用於手寫識別?
我希望能夠根據這些數據對手寫字符進行分類,並且很樂意實現用於學習目的的HMM。但是,這是正確的方法嗎?他們如何被用來做到這一點?
這個問題實際上是兩個問題,一個組合:
的(如噪聲)序列識別字識別一個字符一個使用HMM用於從噪聲測量中找出有限數量的離散狀態的最可能的序列。這正是問題2,因爲離散狀態a-z的噪聲測量0-9在一個序列中跟隨彼此。
對於問題1,HMM是無用的,因爲您對底層序列不感興趣。你想要的是增加你的手寫數字與你如何寫它的信息。個人而言,我會從實施經常性的先進手寫識別開始,這已經非常好(使用卷積神經網絡或深度學習)。之後,您可以添加有關如何寫入的信息,例如順時針/逆時針。
我認爲HMM可以用於@jens提到的兩個問題。我正在從事在線手寫,並且HMM被用於許多文章。最簡單的方法是這樣的:
每個項目:
這是一個非常有趣的想法。出於好奇,每個點記錄的時間座標也是如此(毫秒1個座標是30×45被按下)還是隻是按順序? – Turnsole 2012-02-21 22:56:15
目前只是順序。正在考慮做一些動態時間扭曲,以解釋字符被繪製得更慢/更快 – zebra 2012-02-21 23:08:03
我認爲這是正確的方法。作爲練習,您可以從識別[palm graffite](http://en.wikipedia.org/wiki/Graffiti_%28Palm_OS%29)字母開始。 – Maurits 2012-02-22 23:17:46