-4
我正在做一些類似檢測網站語言。這是關於1k網站,所以我不能做1 1。我認爲這樣做,我需要通過python獲取網站的HTML代碼,並獲取所有的文本,做分析。是否正確,有沒有人做過這樣的事情,這將是非常有幫助:)如何知道一個網站是否是非英語的?
我正在做一些類似檢測網站語言。這是關於1k網站,所以我不能做1 1。我認爲這樣做,我需要通過python獲取網站的HTML代碼,並獲取所有的文本,做分析。是否正確,有沒有人做過這樣的事情,這將是非常有幫助:)如何知道一個網站是否是非英語的?
謝謝大家回答,我找到了一個方法。通過列出網站的alexa排名和大多數訪問者的國家。如果是美國或其他講英語的國家,那麼它是英文網站。
做了python。
SO不是代碼寫入服務。請展示您的嘗試以及您可能面臨的任何錯誤。 – sgp
http://stackoverflow.com/questions/4605062/detecting-whether-or-not-text-is-english-in-bulk 這可能有幫助 – Ajay
你的意思是代碼或內容?那些支持多國語言/ i18n的網站呢? – jonrsharpe