2013-02-11 186 views
0

我試圖在CraigsList中使用以下公式在Google Docs的電子表格中獲取發佈正文中的文本,但保留一條錯誤消息,指出「XPATH查詢未返回任何內容數據。」無法使用ImportXML獲取數據

我使用是式,

= IMPORTXML(D2, 「//部分[@ ID = 'postingbody']」)

其中D2具有張貼網址:http://losangeles.craigslist.org/wst/apa/3608091461.html

我看了幾個參考文獻來檢查我的公式,但我無法弄清楚什麼是錯的。任何幫助深表感謝。先進的謝謝! :)

回答

0

試試這個Xpath表達:

//*[@id="postingbody"]/text() 
+0

嗯,仍然沒有爲我工作。我嘗試用其他「div」和相應的id或class屬性替換「section」,並且似乎工作得很好。只有當我在介紹「部分」的時候,這似乎失敗了。想知道它是不是最新的HTML5的「部分」的引入... – user2060022 2013-02-12 04:46:29

0

這可能僅僅是Craigslist的阻止它,真的有嚴格與他們拼搶規則。

你可以嘗試兩件事情,你可能需要擺弄要提取或要如何格式化其中的一部分:

你可以試試:= REGEXEXTRACT(串連(IMPORTXML(A1,「/ 。/ HTML 「)),」 避免詐騙( \ n *)不 「)

或嘗試:= IMPORTXML(A1,」?// HTML「)

或最後:= importxml(A1,「// body」)

相關問題