2016-04-03 18 views
1

我想爲某些Quora答案拉起投票和查看數據。我正在嘗試使用Google Spreadsheet的IMPORTXML函數執行此操作。爲了得到Upvotes數據,這是我使用的代碼:Google表格的IMPORTXML函數提取一些元素,但不提供其他元素

=IMPORTXML("https://www.quora.com/What-are-the-good-online-tutorials-and-books-to-learn-Android-development/answer/Pushpa-Latha-38","//span[@class='count']") 

出於某種原因,這是示出#N/A(進口內容是空的)消息。當我在Chrome的XPath Helper插件上使用相同的XPath查詢時,我確實得到了這些數據。在執行此操作之前,我也在使用類似代碼獲得對此答案的總體意見:

=IMPORTXML("https://www.quora.com/What-are-the-good-online-tutorials-and-books-to-learn-Android-development/answer/Pushpa-Latha-38","//div[@class='CredibilityFact']") 

這似乎工作正常。但不是第一個。那個怎麼了?

回答

2

importXML的bot抓取頁面是該網站的匿名訪問者。所以它只能得到該網站向匿名訪問者顯示的內容。通過在未登錄的瀏覽器中打開頁面(或在瀏覽器的隱私/隱身窗口中),您會發現沒有類count的元素:upvotes未顯示。


一般來說,看importXML看到的東西,應該在隱身模式下打開網頁,並查看其。除了匿名和登錄訪問者之間的區別之外,許多站點使用JavaScript修改頁面,而importXML bot沒有執行。