我試圖爲了自動化目的而刮掉公司網頁,但頁面中的嵌入式腳本阻止我完全複製請求。最大的麻煩在於腳本生成的cookies。HTML支持JS支持
我想過用Watin實現自動化IE,但是我對服務應用程序下的這個解決方案感到不舒服。
在這種情況下,您有什麼建議?
在此先感謝。
我試圖爲了自動化目的而刮掉公司網頁,但頁面中的嵌入式腳本阻止我完全複製請求。最大的麻煩在於腳本生成的cookies。HTML支持JS支持
我想過用Watin實現自動化IE,但是我對服務應用程序下的這個解決方案感到不舒服。
在這種情況下,您有什麼建議?
在此先感謝。
screen-scraper是另一個旨在易於使用的工具(基於Java)。
的基本思想是拜倫說 - 你必須弄清楚餅乾越來越設定什麼(Web代理工具,如Fiddler,Charles,或瀏覽器擴展類似Firebug和Chrome的開發工具會派上用場)。
因此,您不一定必須閱讀甚至執行頁面上的JavaScript來模仿相同的請求。只需使用代理工具來查看瀏覽器發送給服務器的cookie,一旦知道網站希望接收哪些cookie,就可以用您使用的任何腳本或工具手動進行設置,以達到您的目的。