0
我想刮一個網站的一部分,可以說:www.mywebsite.com/ X1/X2先進的網頁抓取
網站需要登錄信息。
您需要打開X1第一,那麼你點擊一個按鈕,X2將打開一個彈出窗口。如果您關閉x1您將無法訪問x2。
我使用互聯網下載管理器,我想我把正確的登錄信息,但這種失敗,因爲你需要X1被打開,當你訪問X2。
該網站支持JavaScript。
我想刮一個網站的一部分,可以說:www.mywebsite.com/ X1/X2先進的網頁抓取
網站需要登錄信息。
您需要打開X1第一,那麼你點擊一個按鈕,X2將打開一個彈出窗口。如果您關閉x1您將無法訪問x2。
我使用互聯網下載管理器,我想我把正確的登錄信息,但這種失敗,因爲你需要X1被打開,當你訪問X2。
該網站支持JavaScript。
IDM(我看了之後)是用於下載,而不是經常性的網頁抓取。爲什麼不使用特殊的web scraping software?他們大多支持登錄和複雜的HTML和js-driven pages scrape。在我看來,你的情況不是純粹的html頁面,而是一個js-stuffed網頁。
什麼是IDM?你用什麼工具,語言來請求網頁? –
IDM代表稱爲Internet Download Manager的軟件。 – user42987
查看您是否可以登錄並直接**訪問沒有JavaScript的「www.mywebsite.com/x1/x2」(即如果必須,請輸入URL)。這將取決於你是否可以使用簡單的刮板或需要一個完整的無頭瀏覽器(這將會慢得多)。 – halfer