所以,我試圖用JSoup解析一個簡單的列表。不幸的是,該程序只會返回條目直到列表中以N開頭的條目。我不知道爲什麼會這樣。這是我的代碼:JSoup不會獲取所有項目?
public ArrayList<String> initializeMangaNameList(){
Document doc;
try {
doc = Jsoup.connect("http://www.mangahere.com/mangalist/").get();
Elements items = doc.getElementsByClass("manga_info");
ArrayList<String> names = new ArrayList<String>();
for(Element item: items){
names.add(item.text());
}
return names;
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}
那麼爲什麼列表不包含所有的條目?網頁有錯誤嗎?或者也許解析器?我可以使用解決方法繞過此問題嗎?首先是什麼導致了這個問題?
剛剛用jsoup-1.6.1測試了你的代碼,它返回了11906個結果,這是正確的。 – melc
JSoup 1.7.2只返回7031個結果。 – Skylion
賓果發現問題:1.72更新日誌爲Jsoup.Connection添加最大主體響應大小,以防止嘗試讀取超大文檔時內存不足。默認值是1MB。 – Skylion