我想要一個讀取文檔中的文本並說它是用哪種語言(英語,西班牙語,...)的java代碼。文件的格式並不重要。我希望輸出是例如:「這份文件是西班牙文」。請以這種方式引導我,並給我一個示例代碼。語言檢測器
Q
語言檢測器
1
A
回答
3
+0
*「**注意:** Google Language Detect API必須用於用戶生成的語言檢測。嚴格禁止任何類型的自動或批量查詢。「* – 2012-02-06 16:24:40
0
的標準方法是建立n元模型的候選語言,然後建立目標文檔一個類似的模型,並使用一個簡單的比較,對參考模型編輯距離計算。 Gertjan van Noord的網站http://www.let.rug.nl/vannoord/TextCat/competitors.html可鏈接到您可以使用的多個圖書館。
0
language-detection庫在Java中使用非常簡單(請參閱示例代碼)和健壯性。檢測來自各種家庭的至少53種語言。
相關問題
- 1. 瀏覽器語言檢測
- 2. 語言檢測
- 3. 語言檢測
- 4. ANN:語言檢測
- 5. 檢測Facebook語言
- 6. Solr語言檢測
- 7. CLI語言檢測
- 8. 檢測iOS語言
- 9. jQuery的瀏覽器語言檢測
- 10. 瀏覽器自動檢測語言
- 11. 機器人自動檢測語言
- 12. 在java中檢測瀏覽器語言
- 13. Symfony 3,檢測瀏覽器語言
- 14. 春:檢測瀏覽器語言環境
- 15. 檢測瀏覽器語言環境/語言並生成輸出
- 16. 語言檢測API/Library
- 17. 檢測文本的語言
- 18. SOLR 4.1語言檢測
- 19. 檢測Android語言支持
- 20. 檢測NSString的語言
- 21. 檢測語言從RecognizerIntent
- 22. iPad檢測鍵盤/語言
- 23. 的.htaccess的語言檢測
- 24. 較短的語言檢測
- 25. 檢測編程語言
- 26. NLTK和語言檢測
- 27. python網站語言檢測
- 28. 蠻力語言檢測
- 29. 檢測輸入語言?
- 30. CodeMirror - 自動檢測語言
大多數文檔格式將該信息嵌入其元數據中。對於純文本文件,是的,你必須做一些魔術。 – 2012-02-06 16:20:21
這是問題解答網站,那麼你的問題是什麼,我建議閱讀常見問題解答... – Nettogrof 2012-02-06 16:21:34
你需要根據所使用的單詞使用猜測。我會爲每種語言創建一個單詞詞典並嘗試匹配它們。注:一些簡短的文件可能是。 – 2012-02-06 16:21:37