2012-04-07 94 views
0

我最近開始使用Web-Harvest作爲網頁抓取工具。目前,我正在一個項目的開始階段工作,我想要驗證/登錄到一個網站。在開始之前,我想明確說明代碼中的[URL]替換了網頁的實際URL。我的web採集認證配置有什麼問題?

所以,我想通過執行以下配置發佈登錄信息:

<config> 
    <var-def name="result"> 
     <http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&amp;server=1" multipart="true"> 
     <http-param name="login">[myusername]</http-param> 
     <http-param name="password">[mypassword]</http-param> 
    </http> 
</var-def> 
</config> 

如何檢索結果信息,並按照重新的方向?手動登錄時,以下擴展名將添加到URL中。似乎有某種隨機化,並且還添加了一個會話標識。我想這是我需要在我的解決方案中加入的東西?

[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA 

以下是頁面的來源的一部分,這可能是問題的關鍵。它是WebObjects問題嗎?這是一個JavaScript問題?我是問題嗎? :)

<body onload="document.form.login.focus();"> 
    <form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login"> 
... 
</form> 
</body> 

任何幫助是極大的讚賞。

回答

0

確保你已經得到了所有必要的PARAMS登錄。它可能需要的不僅僅是密碼和用戶名。

+0

謝謝,就是這樣。我有兩個參數,我認爲有預定義的值,我不必發佈。 – 2013-02-07 21:07:50