我正在進行第二套住房定價項目,所以我需要從中國最大的第二家交易平臺之一中獲取信息。這裏是我的問題,是頁面上的信息,並使用Chrome「檢查」功能,相應的元素如下:無法使用lxml和xpath從html中檢索文本
我的代碼:
>>>from lxml import etree
>>>import requests
>>>url = 'http://bj.lianjia.com/chengjiao/101101498110.html'
>>>r = requests.get(url)
>>>xiaoqu_avg_price = tree.xpath('//[@id="resblockCardContainer"]/div/div/div[2]/div/div[1]/span/text()')
>>>xiaoqu_avg_price
[]
返回空列表是不可取的(理想情況下它應該是73648)。此外,我認爲它的HTML源代碼,其中顯示:
那麼應該怎麼辦得到我想要什麼?什麼是resblockCard的意思?謝謝。
你試過用'.xiaoqu_main_info/text()' –