2013-02-08 57 views
0

我有我的客戶的電子商店,由另一家公司創建。我想解析所有的產品,並把它們放在一個xml中。我知道如何到達每個「品牌」的第一頁,但我很難通過參數來更改分頁結果的頁面。java - 解析一個aspx網站 - 發佈參數

這是指向一個品牌的電子商店「http://www.gialia.net.gr/ProductCatalog/20/CAR.aspx」。

當在Firefox我的用戶篡改數據我看到,當你想按結果的第二頁是職位:

"__EVENTTARGET=ctl00%24wpmMain%24wp131820866%24wp512420601%24dpgTop%24ctl01%24ctl01" 

最後一個字符串:「CT101」是指進入第2頁,如果我將其更改爲ct102它會轉到第3頁等

但我想創建它作爲GET請求,所以我可以在我的Java代碼中動態創建這些參數並解析每個響應。但當我創建的網址爲:

http://www.gialia.net.gr/ProductCatalog/20/CAR.aspx?__EVENTTARGET=ctl00$wpmMain$wp131820866$wp512420601$dpgTop$ctl01$ctl02 

我沒有得到任何結果。

有人可以請看看,給我一些建議嗎?

+0

使用Apache HttpClient,通過該庫您可以創建POST請求。 – 2013-02-08 23:28:58

回答

0

您給我們的網站在搜索引擎(SEO)的設計上很差,所以頁面的解析一個接一個太難了。

要更改頁面是回發,並只與JavaScript。因此,您必須執行相同的操作才能移動到目錄的下一頁,您需要使用所有參數在頁面上完整發布。

現在,頁面設計的很糟糕,程序員已經禁用了控件的__EVENTVALIDATION,可能是因爲他不讓他做錯誤的事情,所以當你可以篡改數據,但仍然需要回發。通過簡單的URL類型之一隻參數後面的代碼不明白,是回發。你需要發送和至少Viewstate和其他隱藏參數。

但是,從客戶端直接訪問數據庫並從那裏讀取數據並不容易嗎?