0
我最近開始使用Web-Harvest作爲網頁抓取工具。目前,我正在一個項目的開始階段工作,我想要驗證/登錄到一個網站。在開始之前,我想明確說明代碼中的[URL]替換了網頁的實際URL。我的web採集認證配置有什麼問題?
所以,我想通過執行以下配置發佈登錄信息:
<config>
<var-def name="result">
<http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&server=1" multipart="true">
<http-param name="login">[myusername]</http-param>
<http-param name="password">[mypassword]</http-param>
</http>
</var-def>
</config>
如何檢索結果信息,並按照重新的方向?手動登錄時,以下擴展名將添加到URL中。似乎有某種隨機化,並且還添加了一個會話標識。我想這是我需要在我的解決方案中加入的東西?
[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA
以下是頁面的來源的一部分,這可能是問題的關鍵。它是WebObjects問題嗎?這是一個JavaScript問題?我是問題嗎? :)
<body onload="document.form.login.focus();">
<form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login">
...
</form>
</body>
任何幫助是極大的讚賞。
謝謝,就是這樣。我有兩個參數,我認爲有預定義的值,我不必發佈。 – 2013-02-07 21:07:50