我有一個學校項目的想法,並希望就如何實現它提出建議。從數據庫列中檢測字符串值的語言
我想創建一個應用程序,使用戶能夠上傳數據文件。應用程序應能夠檢測文本字段的語言(法語,英語等)並使用該值填充語言列。我最初只能實現幾種語言,應用程序應該在語言欄中給出語言的可能性。例如。 70%法語30%拉丁語。
我腦海中的問題: 我可以自己將這些語言規則實施到我的應用程序中嗎? 什麼是應用程序應寫入的理想編程語言? Java還是C++? 我希望你有任何建議。非常感謝!
我有一個學校項目的想法,並希望就如何實現它提出建議。從數據庫列中檢測字符串值的語言
我想創建一個應用程序,使用戶能夠上傳數據文件。應用程序應能夠檢測文本字段的語言(法語,英語等)並使用該值填充語言列。我最初只能實現幾種語言,應用程序應該在語言欄中給出語言的可能性。例如。 70%法語30%拉丁語。
我腦海中的問題: 我可以自己將這些語言規則實施到我的應用程序中嗎? 什麼是應用程序應寫入的理想編程語言? Java還是C++? 我希望你有任何建議。非常感謝!
你可以試試這個鏈接https://code.google.com/archive/p/language-detection/。
而且,已經有類似的問題存在檢查這個How to detect language of user entered text?
謝謝,應用程序如何能夠更新csv文件? – elmify
試試這個http://viralpatel.net/blogs/java-read-write-csv-file/ –
使用納倫德拉給你的鏈接。谷歌通常有這些類型的東西非常好的資源。
在任何情況下創建一個語言檢測器將是一個更艱難的努力,因爲你需要許多語言和他們的字典數據庫。
還有一個問題,您可能會遇到語言中的相似之處,這將不可避免地使這類問題難以排除。但是,再次,編程是解決問題的...去追求它!
您可以搜索不同語言的免費字典。然後,您可以查找字典中文本字段的所有單詞。你得到的匹配越多,語言就越有可能。 –