我無法獲得包括unicode在內的維基百科網址!使用Java URL的Unicode字符解析維基百科URL時出錯
給定一個網頁的標題,如:1992年\ u201393_UE_Lleida_seasonnow
只是簡單的網址... http://en.wikipedia.org/wiki/1992 \ u201393_UE_Lleida_seasonnow
使用URLEncoder的(設置爲UTF-8).... http://en.wikipedia.org/wiki/1992%5Cu201393_UE_Lleida_seasonnow
當我嘗試解決任何網址時,我什麼都沒有。如果我將url複製到瀏覽器中,我什麼也得不到 - 只有當我實際上覆制unicode字符,才能獲得頁面。
維基百科有一些奇怪的方式來編碼unicode的網址?或者我只是在做一些愚蠢的事情?
下面是我使用的代碼:
URL url = new URL("http://en.wikipedia.org/wiki/"+x);
System.out.println("trying "+url);
// Attempt to open the wiki page
InputStream is;
try{ is = url.openStream();
} catch(Exception e){ return null; }