2013-05-11 92 views
0

我一直在嘗試從http://osu.ppy.sh/u/2330158下載html以獲取歷史數據 ,但它不下載該部分。它也下載一般,頂級等Wget下載html

有沒有辦法讓wget下載它?

+0

通過ajax加載部分內容的網站並不容易通過wget獲取。也許你可以開始使用硒。 – luksch 2013-05-11 10:42:21

回答

2

頁面的這一部分是動態加載的,所以wget不會看到它,因爲它不支持Javascript。但是,如果您在選擇的瀏覽器中打開Web開發人員工具,然後加載主頁面,則可以獲取您真正關注的URL。對於這個頁面,它是:http://osu.ppy.sh/pages/include/profile-history.php?u=2330158&m=0

幸運的是,這是另一種簡單的,參數化的URL,因此你可以說給wget:

wget "http://osu.ppy.sh/pages/include/profile-history.php?u=2330158&m=0" 

那你拿一個僅包含你的歷史數據的HTML文檔尋找。

+0

謝謝你的chooban! – Mikiku 2013-05-11 11:11:14

+0

如果他的答案令人滿意,你應該考慮接受答案,並考慮提高答案。 – luksch 2013-05-11 11:41:33

+0

這兩種行爲都很可愛! :) – chooban 2013-05-11 12:03:26