2011-06-28 53 views
1

我想從內部網站獲取信息,但受登錄保護。它是一個帶有auth插件的drupal網站。從外部服務器(Java,Groovy)訪問登錄受保護的頁面

使用

def slurper = new XmlSlurper() 

def htmlParser = slurper.parse("http://theurl.se/pageIwantToGo") 

返回403 (Forbidden),我不能在該網頁訪問的內容。

new URL('http://theurl.se/pageIwantToGo:).getText() 

從瀏覽器中,我得到一個頁面,具有form_build_id,我可能需要閱讀和用戶名和密碼一起提交登錄表單:與

同樣的事情。

如何欺騙我是瀏覽器的網站,以便我可以訪問該網頁? 已嘗試使用groovy HTTPBuilder,但無法通過第一步。

+0

因此[使用HTTPBuilder進行基本身份驗證](http://groovy.codehaus.org/modules/http-builder/doc/auth.html)不起作用? –

回答

0

這取決於如何實施安全(基本身份驗證,表單登錄,....)。 Java中的大多數HTTP庫(例如:Apache HttpComponents)支持各種安全機制。

把網站弄糊塗以爲你是瀏覽器不會讓你進入。如果你想(但我不認爲這是必需的),你可以通過設置「愚弄」網站,認爲你是瀏覽器HTTP頭中適當的用戶代理。 (儘管這本身不會繞過安全)