2012-02-20 21 views
1

背景:檢測語句(20到200個字符)。

  • 我想自動檢測通過在字段中的文本用戶編寫的語言。
  • 用戶可以寫10到200個字符。
  • 大部分將會是西班牙語和英語。
  • 我正在用PHP和Code Igniter編程一個web。

我的解決辦法:我使用的庫。我發現的最好的是Text LanguageDetect 0.3.0。但有時它會失敗(即使我將語言限制爲西班牙語和英語)。

幫助/建議: 是否因爲圖書館不太好?你更瞭解別人嗎? 還是因爲我問很多?只用20個字符檢測語言。

謝謝!

+1

可能是因爲20個字符可能是一個壞的樣本量。通常你只想用那種語言尋找最常見的單詞就是你最好的選擇 – 2012-02-20 09:27:53

+0

你可以舉一個20個字符的文本的例子,但它不能被正確檢測嗎? – 2012-02-20 09:32:41

+0

李斯特先生,你好。讓我澄清一下。如果我將語言設置爲英語和西班牙語(然後我只有<10個字符的問題),使用20個字符可以很好地工作。但是,如果我包括葡萄牙語或意大利語,它不能檢測到西班牙語(很多時候用20次,有時用長句 - > 100次) – 2012-02-20 17:22:46

回答

2

你可以嘗試使用谷歌翻譯API,但這項服務的非自由

http://code.google.com/apis/language/translate/v2/using_rest.html#detect-language

+0

謝謝維克多。我知道這個工具,但首先,如果可能的話,我想嘗試免費的。 – 2012-02-20 17:23:51

+0

如果您想嘗試訪問http://translate.google.com/,請輸入您的文字,然後在下拉菜單的「發件人」中選擇選項「檢測語言」 – 2012-02-21 08:16:03

相關問題