網站要連接到明明檢查用戶代理字符串,並提供不同的頁面,根據它獲取用戶代理字符串發送。
如果您指示xidel
發送用戶代理字符串,則可以冒充爲例如。做網頁抓取和越來越怪異結果時
> ./xidel --silent --user-agent="Mozilla/5.0 (Windows NT 10.0; WOW64; rv:49.0) Gecko/20100101 Firefox/49.0" "http://www.iec-iab.be/nl/contactgegevens/c360afae-29a4-dd11-96ed-005056bd424d" -e '//div[@class="consulentdetail"]'
Lidnummer11484 2 N 73
TitelAccountant, Belastingconsulent
TaalNederlands
Accountant sinds4/04/2005
Belastingconsulent sinds4/04/2005
AdresStationsstraat 2419550 HERZELE
Telefoon+32 (53) 41.97.02
Fax+32 (53) 41.97.03
AdresStationsstraat 2419550 HERZELE
Telefoon+32 (53) 41.97.02
Fax+32 (53) 41.97.03
GSM+32 (474) 29.00.67
Websitehttp://abbeloosschinkels.be
E-mail
<!--
document.write("<a href=mailto:");document.write(decrypt(unescCtrlCh("5yÿÃ^à (pñ_!13!Â[îøû!13!5ãév¦Ãçj|°W"),"Iate1milrve%ster"));document.write(">");document.write(decrypt(unescCtrlCh("5yÿÃ^à (pñ_!13!Â[îøû!13!5ãév¦Ãçj|°W"),"Iate1milrve%ster"));document.write("</a>");
-->
作爲一個經驗法則,:
- 檢查頁面與禁用JavaScript瀏覽器火狐在Windows 10,您的查詢開始工作。
- 發送模擬Web瀏覽器的用戶代理字符串。
'// div'找到了什麼?如果沒有發現,那麼XPath表達式就不存在問題。 – Tomalak
它確實沒有發現任何東西。但'join(// div,「」)'輸出一串文字 – Fuzzyma
好奇,出於某種原因,我確實得到了'// * [@ class =「consulentdetail」]' – Tomalak