我正在編寫一個程序,該程序可以提取和編輯維基百科上的文章,並且在處理Unicode字符前綴\ u時遇到一些麻煩。我已經試過.encode(「utf8」),並且這似乎不是在這裏做的。如何正確編碼這些以\ u爲前綴的值以發佈到維基百科?有關我的問題,請參閱this edit。 下面是一些代碼:之前我發佈的頁面Python - 在HTTP POST請求中發送unicode字符(前綴爲 u)
url = "http://en.wikipedia.org/w/api.php?action=query&format=json&titles="+urllib.quote(name)+"&prop=revisions&rvprop=content"
articleContent = ClientCookie.urlopen(url).read().split('"*":"')[1].split('"}')[0].replace("\\n", "\n").decode("utf-8")
:
data = dict([(key, value.encode('utf8')) for key, value in data.iteritems()])
data["text"] = data["text"].replace("\\", "")
editInfo = urllib2.Request("http://en.wikipedia.org/w/api.php", urllib.urlencode(data))
我們希望看到一些代碼。 – georg
我會在一秒鐘內添加一些。 –
我希望看到一些示例數據;您將'u2013'作爲文本文本(5個字符)發佈,它看起來並不像您首先有一個'\ u2013'碼點(*一個*字符)。 –