我想提取字WHITE在去下面的HTML提取串上scrapy
<p class="current">(WHITE)</p>
我使用python-scrapy,它是唯一可能的提取使用XPath。使用Chrome時,我得到的XPath:
//*[@id="addToCart_pdp"]/div[3]/div[1]/p
使用scrapy我得到
hxs.select('//*[@id="addToCart_pdp"]/div[3]/div[1]/p')
>> [<HtmlXPathSelector xpath='//*[@id="addToCart_pdp"]/div[3]/div[1]/p' data=u'<p class="current"></p>'>]
,但不能從這個得到了這個詞白色。
這不是問題所在。我嘗試了這些組合。我認爲問題在於HTML的生成方式不同,scrapy會下載該頁面,當我在瀏覽器上閱讀該內容時。 – zeferino
好吧,我只是回答你問過的問題。然後,提供您嘗試從中刪除的網址。 – alecxe