2012-05-05 48 views
0

我從DBpedia中使用耶拿和自耶拿的輸出是基於XML得到了一些數據,因此也有一些情況是XML字符需要區別對待類似以下內容:這是什麼樣的編碼?

Guns n ' Roses 

我只是想知道什麼樣的的經費是這個嗎? 我想根據上面的編碼(r)在javascript的幫助下對我的輸入進行解碼/編碼,並將它發送回servlet。

(編輯後,如果您刪除&之間的空間和功放,你會得到正確的字符,因爲在計算器我無法找到一個方法來做到這一點,我決定把這樣的!)

+0

這是編碼兩次,這是(很可能)一個錯誤。這發生在哪裏? –

回答

2

似乎是XML實體編碼,並且數字字符引用(十進制)。

數字字符引用是指一個角色通過其Universal Character Set/Unicode代碼點,並使用格式

你可以在這裏得到一些信息:List of XML and HTML character entity references on Wikipedia

你的字符數是39,爲撇號:',其也可以與字符實體引用引用:'

要使用Javascript對此進行解碼,可以使用例如php.js,該函數具有html_entity_decode()函數(注意取決於get_html_translation_table())。


UPDATE:在回答您的編輯:基本上是一樣的,唯一不同的是,這是(錯誤可能)編碼兩次&是&符號:&