我正在寫一個python腳本,用於批量替換HTML文件中的鏈接(實際上是圖像和腳本源);我正在使用lxml。有一個問題,在HTML文件測驗和他們有包裝類似這樣的數據(也存在一些西里爾這裏):在Python中的HTML解碼
<input class="question_data" value="{"text":"<p>[1] је наука која се бави чувањем, обрадом и преносом информација помоћу рачунара.</p>","fields":[{"id":"1","type":"fill","element":{"sirina":"103","maxDuzina":"12","odgovor":["Информатика"]}}]}" name="question:1:data" id="id3a1"/>
當我嘗試在Python打印出該數據使用:
print "OLD_DATA:", data
它只是打印出錯誤「UnicodeEncodeError:字符映射到未定義」。還有更多這些元素。我的目標是改變輸入值部分中圖像的鏈接,但如果我不知道如何打印這些數據(或如何將其寫入文件),我無法更改這些鏈接。 Python如何處理(解釋)這個?請幫忙。謝謝!!! :)
你使用Python 2.7? –
是的,Python 2.7.11是精確的。 – McLinux