Q
語言檢測
4
A
回答
3
本文「Natural Language Identification for OCR Applications」描述了與您的要求類似的識別任務中涉及的技術。
3
我不確定這是否會對Java庫有幫助。但是我發現它非常酷,因爲它能夠從給定的文本中檢測大約50種語言,並且具有相當好的精確度。您可能希望看看它,因爲它是開源的,如果您的應用程序只需要用C++編寫,您可以用C++重寫代碼並將其返回給開源社區。
這裏是鏈接一樣:
http://code.google.com/p/language-detection/
注:它使用了Apache的Nutch和提卡庫進行分析。
0
您可能想要閱讀我的論文The WiLI benchmark dataset for written language identification並嘗試lidtk
。
TL; DR:試一試CLD-2。
相關問題
- 1. 語言檢測
- 2. 語言檢測器
- 3. ANN:語言檢測
- 4. 檢測Facebook語言
- 5. Solr語言檢測
- 6. CLI語言檢測
- 7. 檢測iOS語言
- 8. 語言檢測API/Library
- 9. 檢測文本的語言
- 10. SOLR 4.1語言檢測
- 11. 檢測Android語言支持
- 12. 檢測NSString的語言
- 13. 檢測語言從RecognizerIntent
- 14. iPad檢測鍵盤/語言
- 15. 的.htaccess的語言檢測
- 16. 較短的語言檢測
- 17. 檢測編程語言
- 18. NLTK和語言檢測
- 19. python網站語言檢測
- 20. 蠻力語言檢測
- 21. 檢測輸入語言?
- 22. CodeMirror - 自動檢測語言
- 23. 瀏覽器語言檢測
- 24. JMSI18nRoutingBundle檢測首選語言
- 25. Qt:安裝語言包時檢測系統語言環境
- 26. 檢測瀏覽器語言環境/語言並生成輸出
- 27. 檢測語言和django語言環境-url
- 28. 微軟認知語言到文本 - 檢測語言
- 29. 在html中檢測系統語言環境(語言)
- 30. jQuery的瀏覽器語言檢測