在OpenNLP培訓中,cut-off
和iteration
的含義是什麼?或者就此而言,自然語言處理。我只需要一個外行人對這些條款的解釋。就我的想法而言,迭代是算法重複和切斷的次數,如果文本的值高於某個特定類別的值,它將被映射到該類別。我對嗎?OpenNLP中的「cut-off」和「iteration」是什麼意思?
6
A
回答
12
正確的,術語迭代指迭代算法,其中一個規定了通過連續地產生的一些「理想」溶液(希望日益更準確)的近似解決問題的一般概念。一般而言,迭代次數越多,結果越準確(「越好」),但當然需要執行更多的計算步驟。
術語截止(又名截止頻率)被用於指定降低的的n-gram語言模型大小(13759 OpenNLP,例如其一部分的詞性標註器)的方法。考慮下面的例子:
Sentence 1 = "The cat likes mice."
Sentence 2 = "The cat likes fish."
Bigram model = {"the cat" : 2, "cat likes" : 2, "likes mice" : 1, "likes fish" : 1}
如果在這個例子中設置的截止頻率爲1時,n元語法模型將減少到
Bigram model = {"the cat" : 2, "cat likes" : 2}
即,切斷方法從語言中刪除對那些在訓練數據中很少出現的n-gram進行建模。減少n-gram語言模型的大小有時是必要的,因爲甚至bigrams的數量(更不用說trigrams,4-gram等)爲更大的語料庫而爆炸。然後可以使用重新生成信息(n-gram計數)來統計估計字(或其POS標籤)在給定前 字(或POS標籤)的情況下的概率。
相關問題
- 1. 是什麼意思:是什麼意思?
- 2. SURF的min_dist和max_dist是什麼意思,FlannMatcher是什麼意思
- 3. '。'是什麼意思?和'..'的意思是在Matlab dir()命令中?
- 4. `^^^`和`〜>`是什麼意思?
- 5. Clojure:`和〜@是什麼意思?
- 6. `|`和`&是什麼意思?
- 7. 什麼是目錄名'。'和'..'是什麼意思,faDirectory是什麼意思?
- 8. 語句中的問號和冒號是什麼意思?這是什麼意思?
- 9. 是什麼意思,在Python中是什麼意思?
- 10. c。宏中的`.`和`*`是什麼意思?
- 11. 什麼|和「是什麼意思?
- 12. 「?」是什麼意思?調用jsp的標記是什麼意思?
- 13. %{}是什麼意思?
- 14. '#'是什麼意思?
- 15. 「?」是什麼意思?
- 16. #{...}是什麼意思?
- 17. || =是什麼意思?
- 18. @是什麼意思
- 19. $$ $$是什麼意思?
- 20. `/ * @`是什麼意思?
- 21. 「=」是什麼意思
- 22. + =是什麼意思?
- 23. {..} [..]是什麼意思?
- 24. 什麼是:!:意思?
- 25. @ []是什麼意思?
- 26. 什麼是「||」意思?
- 27. /([^.]*)\.(.*)/是什麼意思?
- 28. &**是什麼意思?
- 29. @(...)是什麼意思?
- 30. &@是什麼意思?