- 我想自動檢測通過在字段中的文本用戶編寫的語言。
- 用戶可以寫10到200個字符。
- 大部分將會是西班牙語和英語。
- 我正在用PHP和Code Igniter編程一個web。
我的解決辦法:我使用的庫。我發現的最好的是Text LanguageDetect 0.3.0。但有時它會失敗(即使我將語言限制爲西班牙語和英語)。
幫助/建議: 是否因爲圖書館不太好?你更瞭解別人嗎? 還是因爲我問很多?只用20個字符檢測語言。
謝謝!
我的解決辦法:我使用的庫。我發現的最好的是Text LanguageDetect 0.3.0。但有時它會失敗(即使我將語言限制爲西班牙語和英語)。
幫助/建議: 是否因爲圖書館不太好?你更瞭解別人嗎? 還是因爲我問很多?只用20個字符檢測語言。
謝謝!
你可以嘗試使用谷歌翻譯API,但這項服務的非自由
http://code.google.com/apis/language/translate/v2/using_rest.html#detect-language
謝謝維克多。我知道這個工具,但首先,如果可能的話,我想嘗試免費的。 – 2012-02-20 17:23:51
如果您想嘗試訪問http://translate.google.com/,請輸入您的文字,然後在下拉菜單的「發件人」中選擇選項「檢測語言」 – 2012-02-21 08:16:03
可能是因爲20個字符可能是一個壞的樣本量。通常你只想用那種語言尋找最常見的單詞就是你最好的選擇 – 2012-02-20 09:27:53
你可以舉一個20個字符的文本的例子,但它不能被正確檢測嗎? – 2012-02-20 09:32:41
李斯特先生,你好。讓我澄清一下。如果我將語言設置爲英語和西班牙語(然後我只有<10個字符的問題),使用20個字符可以很好地工作。但是,如果我包括葡萄牙語或意大利語,它不能檢測到西班牙語(很多時候用20次,有時用長句 - > 100次) – 2012-02-20 17:22:46