我知道如何生成一個句子到n-gram。 例如:一元模型和二元(使用數字序列)從n-gram設置所有可能的序列
1 2 3 4 5 (original senctence)
=>
1,2,3,4,5 (unigram)
12,23,34,45 (bigram)
如何單字組和二元(或更高版本的n-gram)相結合,使具有相同的原始長度的所有可能的句子。
1,2,3,4,5 (unigram)
12,23,34,45 (bigram)
=>
1 2 3 4 5
1 2 3 45
1 2 34 5
1 23 4 5
1 23 45
12 3 4 5
12 3 45
12 34 5
我想找到算法來解決這個問題。 謝謝!
遞歸 - 在每一步輸出1或2個單詞(例如:1或12)。完成後,回溯/記住舊狀態。而已。 –