0
已經有很多關於確定文本文件和網頁的字符編碼的討論。使用異步的App Engine上的網頁charcode提取UrlFetch
對於網頁,它似乎最好/簡單的方法是使用一個庫,它將Url作爲輸入並返回正確編碼的字符串。由於庫正在獲取文檔,因此可以使用HTTP標頭來幫助確定編碼。
- http://htmlcleaner.sourceforge.net/download。
- How do you Programmatically Download a Webpage in Java
- character encoding in a web page using java
- http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html
如果我們想獲取使用網址抓取特別是異步API文檔,最新最好的辦法,圖書館嗎?用於確定編碼。
是否有與異步urlfetch集成(或可以很容易地修改爲集成)的任何庫?