2012-08-16 120 views
-1

我正在使用SOAP,並收到以下XML值。如何解碼這個字符串?

<Name>&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F; &#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;&#xD0;&#x98;&#xD0;&#xBC;&#xD1;&#x8F;</Name> 

發件人告訴我這是俄文,但我不知道如何解碼它。當我用.net解碼時,我得到的只是「???????」

即使是一個有效的編碼字符串?這叫什麼?

+1

如果是UTF-8字節爲HTML字符實體,則該字符串爲「ИмяИмяИмяИмяИмяИмяИмяИмя 」。 – MRAB 2012-08-16 19:13:06

+0

MRAB //是的,這正是發件人所說的。你是如何解碼它的? – Moon 2012-08-16 19:55:12

+1

我用Python 3:'import re;字符串= b」的 Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ  Ð Ð ˜ ¼ Ñ 「; re.sub(br「&#x(\ w +);」,lambda m:bytes([int(m.group(1),16)]),string).decode(「utf-8」)' – MRAB 2012-08-16 21:41:39

回答

2

這看起來像html實體給我。 要解碼它,你需要源編碼。例如KOI8-R

你可以試着圍繞這個工具:http://2cyr.com/decode/?lang=en 這是一個通用的在線西里爾解碼器

+0

Thanks !這是非常有用的工具! – Moon 2012-08-16 20:09:16