我正在研究一個系統,可以根據各種用戶輸入(如音節模板或修改的Backus Naur表單)創建構成fanatsy的單詞。然而,一種新模式計劃爲機器學習。在這裏,用戶沒有明確定義任何規則,而是粘貼一些文本,系統學習給定單詞的結構並創建相似的單詞。機器學習的單詞結構
我現在幼稚的做法是創建信鄰里概率表(包括特殊結束字「字母」),並通過字母對掃描輸入(使用空格和標點符號作爲單詞加油吧邊界)。創建一個詞將意味着查找每個字母的概率以跟隨當前字母,並根據概率隨機選擇一個,並重復,直到遇到字末尾。
但我正在尋找更復雜的方法(可能?)提供更好的結果。我對機器學習知之甚少,因此對主題,技術或算法的指點表示讚賞。
一個小問題:在語言中,如果您生成單詞序列(另一個問題)或字母序列(您要求的),可能會生成一個新的單詞/字母,考慮到最後**兩個**字/字母(而不只是一個)。它仍然涉及相同的算法。其他文字/字母不會產生明顯更好的結果。 – Fezvez