2016-10-28 151 views
-1

我解析JSON與python中的cjson庫。該字段的文本包含像這樣的轉義URL:http:\/\/domain.com\/index.html。然而,當我使用cjson分析領域中,我得到一個Unicode對象,看起來像這樣:雙重逃脫unicode網址

`u'Payload text http:\\/\\/domain.com\\/index.html'` 

貌似網址轉義兩次我試圖對其進行解碼,但我總是得到相同的結果(?)。例如:

payload['text'].encode('ascii', 'ignore').decode('string_escape') 

這將返回相同的響應,雙重轉義的URL。我該怎麼辦?我知道我在這裏提出了一些概念性錯誤,並沒有意識到unicode編碼的工作原理。

回答

0

如果您打印u'Payload text http:\\/\\/domain.com\\/index.html',您會看到結果爲Payload text http:\/\/domain.com\/index.html。它沒有雙重轉義,你看到的是字符串的repr,而不是字面值。