我需要使用波特詞幹算法得到在我的應用乾的話,但是當我測試的算法,這是我從http://www.tartarus.org/~martin/PorterStemmer得到的,所產生的結果是不給我正確的幹字,如: 高興 - >本刊 virus - > viru etc 你能幫我解決嗎?爲什麼我的porter stemmer算法的結果還沒有按照這個詞根呢?
1
A
回答
2
從link報價:
2.爲什麼詞幹不產生適當的話?
它通常被認爲是一個粗略的錯誤,詞幹算法不會在刪除詞幹後留下真正的詞。但是,詞幹的目的是將不同形式的單詞組合在一起,而不是將單詞映射到其「範式」形式上。
並連接與此,
3.爲什麼有錯誤?
問題通常進來的形式,爲什麼要字X加以遏制,以X1,當一個本來期望它加以遏制,以X2?請務必記住,干擾算法無法達到完美。總的來說,它會(或可能)改善IR的表現,但在個別情況下,它有時可能會造成錯誤或似乎錯誤。當然,這與提出可能包含在詞幹分析者中以提高其性能的附加規則是不同的。
+0
所以我有額外的規則? – user495688 2010-12-23 07:55:09
相關問題
- 1. Porter Stemmer算法的「相反」?
- 2. Porter Stemmer算法問題
- 3. 信息檢索中的Porter stemmer算法
- 4. Rails是否有porter stemmer(英語詞幹)?
- 5. Perl Porter Stemmer
- 6. Porter Stemmer代碼
- 7. Porter Stemmer和Weka
- 8. JavaScript沒有按照我的要求去做!這是爲什麼?
- 9. Lucene Porter Stemmer線程安全?
- 10. Lucene Porter Stemmer未公開
- 11. 爲什麼Porter Stemmer會產生一個可以再次阻止的字符串?
- 12. Lucene 4.1.0 Porter Stemmer無法正常工作
- 13. 爲什麼Django說我還沒有設置DATABASE_ENGINE呢?
- 14. 爲什麼這個語句與按位運算符相同呢?
- 15. 通過Porter Stemmer運行一個文件
- 16. 爲什麼這個表達式與算法成本相關有這個結果?
- 17. 爲什麼我得到這個結果?
- 18. 有沒有什麼方法可以縮短這個代碼呢?
- 19. 爲什麼C#沒有按照正確的順序計算我的公式?
- 20. 爲什麼我還沒有完成這個代碼?
- 21. 爲什麼這個算術表達式產生這個結果?
- 22. 爲什麼ANTLR沒有按照我的預期來認識這條規則?
- 23. 爲什麼這個承諾還在等待呢?
- 24. 爲什麼我的表單沒有按照它應該更新?
- 25. 快照,在一個空的快照還沒有被渲染結果的圖,
- 26. 爲什麼這個有效的C? ---({123;})的計算結果爲123
- 27. 這個xPath沒有給出任何結果,爲什麼?
- 28. 爲什麼這個字段沒有顯示在結果中?
- 29. Elixir:這是什麼樣的列表還有豎條呢?
- 30. 將porter stemmer模塊添加到drupal
你的問題是相當不連貫的... – Falmarri 2010-12-23 07:31:51