我試圖從舊的html頁面中獲取數據。Scrapy1.1/Python3從字符串中刪除字符串
Python3 Debian的 Scrapy 1.1
我看到一對夫婦例如什麼,我想在這裏做的,但對於我不明白,我無法重現我的結果的原因:
我想要得到的信息是聯繫人姓名這裏(李四)
<p><strong>Contact: <a href="http://www.example.com/t/search-title-Proprietor.html" style="color:#259cd5">Proprietor</a> John Doe</strong></p>
我能夠用Scrapy返回:
Contact: [u'Contact: ', u' John Doe']
唯一的問題是,「聯繫人:」部分是寫在我的CSV文件...
Contact: , John Doe
我嘗試了一堆正則表達式,並與可變玩,但我總是得到另一個問題。
這是我使用來獲取數據的內容:
item['Contact'] = response.xpath('//*[@id="main-contain"]/div[2]/div/div[6]/p[10]/strong/text()').extract()
我也試圖與.replace(),但我最終
[u'', u' John Doe']