0
A
回答
2
最好的做法是在POS標記之前將truecasing應用於您的文本。
如果這是你太多efford,你可以改變你的Python字符串x
降低使用x.lower()
字符,至少應該避免只獲得專有名詞標籤的問題(可能會有一些困惑與過少專有名詞標籤雖然)。
您可以通過將標記語料庫先前轉換爲lower
來培訓POS標記語,但如果您想獲得最佳結果,則可能需要進行正確分類。
相關問題
- 1. PHP上傳全部失敗
- 2. mod_rewrite在大寫目錄上失敗
- 3. 大文件上傳失敗
- 4. Android 5.0(Lollipop)小部件按鈕的文本全部大寫
- 5. 顯示在文本框中的內容全部以大寫
- 6. PHP - 全部大寫?
- 7. 寫入文件/大量字節失敗
- 8. PGP加密在大文件上失敗
- 9. seekg,在大文件上失敗
- 10. XMLHTTPRequest在大文件上失敗
- 11. 耙試驗全部失敗
- 12. sfValidatorDoctrineUnique失敗,大寫字母
- 13. 沙盒安全性導致大型文本數據源失敗
- 14. 文字變換之間的區別:大寫;並全部大寫
- 15. 大量上傳Perl/CGI腳本失敗
- 16. GetObject在文本光標上失敗
- 17. Aspose.PDF如何替換PDF頁面上的文本替換爲全部大寫
- 18. php在Dreamhost上調整類大圖失敗的文件大小
- 19. 使textarea全部大寫?
- 20. PHP刪除全部大寫
- 21. PHP日誌全部大寫
- 22. 列標題全部大寫
- 23. 部署在JBoss上,Intellij部分失敗
- 24. gzip在寫入文件中的大量數據時失敗
- 25. rtmedia上傳大圖像文件失敗
- 26. Renci SSH NET上傳大文件失敗
- 27. 上傳大尺寸文件失敗igUpload
- 28. 大文件上傳失敗php
- 29. Web2py上傳大文件SSL失敗
- 30. 在大文件上JQuery Ajax文件上傳失敗
在轉換爲小寫的語料庫上培訓新的標記器效果稍好一些,但仍然沒有給出我想要的結果。到底什麼似乎起作用(我沒有嚴格測試過)是在培訓一個標記器,將單詞標記爲小寫字母,大寫字母或大寫字母。 – Bradley