2014-01-05 54 views
0

我在嘗試使用wget檢索特定php腳本的OUTPUT時遇到此問題,但它看起來像本站點會生成2個相同的PHP文件。頁面有兩個相同名稱的PHP文件如何wget正確的php文件?添加標識符?

第一個較小,第二個按順序是正確的。問題是每一次我嘗試wget命令的時候,我最終了最小的輸出文件,其中不包含所需信息:(

有沒有辦法下載正確的文件,使用wget,通過添加一些排序標識的鏈接,以確保我下載了正確的文件

這是我一直在努力的命令:

$ wget http://www.fernsehen.to/index.php 

如果你的跑步/玩這個和使用Fidller或Wireshark的爲了捕捉,你最終會得到兩(2)個「http://www.fernsehen.to/index.php」,我需要更大的文件兩項。

P.S.要手動獲取所需的輸出文件,您可以在Firefox中打開http://www.fernsehen.to/index.php或查看源代碼。

預先感謝您!

+0

你確定第一個響應不是重定向嗎? (http://en.wikipedia.org/wiki/URL_redirection) –

+0

這是一個好點,但我不完全確定。提琴手顯示兩個完全相同名稱的文件,我只需要指向一個。顯然wget使用第一個:( – user2957951

回答

3

你想要的東西實際上並不可行。當你訪問該頁面時,他們首先生成一個帶有Javascript負載的小文件,該文件檢測瀏覽器功能,並以有狀態的方式將它們發送回服務器,以便生成瀏覽器所需的確切代碼,可能包括支持主要用於視頻編解碼器。也許他們也會爲了DRM目的而做一些會話指紋識別,以阻止你這樣的人從你想要做的事情。

wget無法模擬此行爲,因爲它不是一個完整的瀏覽器,並且不能執行所有該Javascript,也不能正確提供類似瀏覽器的數據。您必須編寫大量的自定義代碼,這些代碼完全模仿了頁面爲實現預期效果所做的一切。可能的,但並不容易,而且肯定不會使用像wget這樣的基本通用工具。

+0

謝謝尼爾斯!我遇到過類似的情況,其中2個文件生成具有完全相同的名稱,並得到正確的一個,我不得不添加一個標識符(請求頁中找到)到實際的PHP鏈接,這似乎已經完成了這個技巧,在這個特殊情況下,我很困惑!!! – user2957951

+0

他們可以在頁面內部做任何事情 - 設置cookie,生成標識符和所有內容。就像我說的,這總是可能的,但通常像這樣的情況比'只是添加標識符'困難得多。 –

相關問題