我有一個html文件中下面的文字:「UTF-8」編解碼器不能在位置0解碼字節0xd0:無效延續字節
<a href="#">�'ам интересна информация</a>
,我使用下面的表達式提取文本:
row.xpath("string(./td[@class='col2 td-tags']/h3/a/text())")
這個表達式工作正常進行簡單的英語,但對於上面的字符串,它拋出這個錯誤:
'utf8' codec can't decode byte 0xd0 in position 0: invalid continuation byte
我已經更新了html代碼,請看看它 – wasimbhalli