2016-10-24 65 views
2

我xidel命令如下:XPath表達式返回空輸出

xidel "https://www.iec-iab.be/nl/contactgegevens/c360afae-29a4-dd11-96ed-005056bd424d" -e '//div[@class="consulentdetail"]' 

這應該提取所有數據中的div類consulentdetail 沒什麼特別我想,但它不會顯示任何信息。

任何人都可以幫我找到我的錯誤嗎?

//編輯:當我使用在Firefox相同的表達找到所需的標籤

+0

'// div'找到了什麼?如果沒有發現,那麼XPath表達式就不存在問題。 – Tomalak

+0

它確實沒有發現任何東西。但'join(// div,「」)'輸出一串文字 – Fuzzyma

+0

好奇,出於某種原因,我確實得到了'// * [@ class =「consulentdetail」]' – Tomalak

回答

1

網站要連接到明明檢查用戶代理字符串,並提供不同的頁面,根據它獲取用戶代理字符串發送。

如果您指示xidel發送用戶代理字符串,則可以冒充爲例如。做網頁抓取和越來越怪異結果時

> ./xidel --silent --user-agent="Mozilla/5.0 (Windows NT 10.0; WOW64; rv:49.0) Gecko/20100101 Firefox/49.0" "http://www.iec-iab.be/nl/contactgegevens/c360afae-29a4-dd11-96ed-005056bd424d" -e '//div[@class="consulentdetail"]' 
Lidnummer11484 2 N 73 
TitelAccountant, Belastingconsulent 
TaalNederlands 
Accountant sinds4/04/2005 
Belastingconsulent sinds4/04/2005 
AdresStationsstraat 2419550 HERZELE 
Telefoon+32 (53) 41.97.02 
Fax+32 (53) 41.97.03 
AdresStationsstraat 2419550 HERZELE 
Telefoon+32 (53) 41.97.02 
Fax+32 (53) 41.97.03 
GSM+32 (474) 29.00.67 
Websitehttp://abbeloosschinkels.be 
E-mail 

<!-- 
document.write("<a href=mailto:");document.write(decrypt(unescCtrlCh("5yÿÃ^à(pñ_!13!­[îøû!13!5ãév¦Ãçj|°W"),"Iate1milrve%ster"));document.write(">");document.write(decrypt(unescCtrlCh("5yÿÃ^à(pñ_!13!­[îøû!13!5ãév¦Ãçj|°W"),"Iate1milrve%ster"));document.write("</a>"); 
--> 

作爲一個經驗法則,:

  1. 檢查頁面與禁用JavaScript瀏覽器火狐在Windows 10,您的查詢開始工作。
  2. 發送模擬Web瀏覽器的用戶代理字符串。