我正在構建一個刮板以從網站獲取產品價格。Scrapy:無法從我的項目數據中刪除unicode(價格)
此刻,我有以下代碼:
def parse(self, response):
for tank in response.xpath('//html/body/div/div[4]/div/div/div/table[1]/tr/td/div/span/span'):
item = VapeItem()
item["price"] = tank.xpath("text()").extract()
yield item
這裏是JSON輸出:
{"price": ["5,00 \u20ac\n \n \n \n \n \n *\n \n \n \n "]},
我已經試過編碼( 「UTF-8」),帶材,替代,但似乎沒有任何工作。
我的問題是:如何使輸出可讀。要麼「5.00€」(\ u20ac)或只是「5.00」
在此先感謝!
Woops ..好吧。我的問題是:如何使輸出可讀。要麼「5.00€」(\ u20ac)或只是「5.00」 – Demandar
然後回答是:您的輸出已經可讀,'\ u20ac' == =='''。你看到它的unicode表示,但是如果你做'print item ['price'] [0]',你會看到它在那裏。 – eLRuLL