我有一些像這樣的元素的XML文件:與Python解析XML文件並獲得每一個列表元素字母「U」
<RMS>[14.470156174, 14.470156174, 14.485567944, 14.496014765]</RMS>
我想要得到的所有元素的列表
所以我嘗試了一些正則表達式用下面的代碼:
string = dom.getElementsByTagName('RMS')[0].toxml()
string2 = re.findall("[\-]*[0-9]*\.[0-9]*", string)
現在,當我想打印的清單,它看起來像這樣:
[u'14.470156174', u'14.470156174', u'14.485567944', u'14.496014765']
'u'是怎麼回事?
是否有任何想法如何解決這個問題? 感謝您的幫助。
OP *是*使用minidom(因此是XML解析器),並且只使用元素文本的正則表達式。 lxml和ElementTree都會返回unicode值。 –
@MartijnPieters:哦,好的,謝謝。我錯過了。 – unutbu
你的新例子是*也*返回一個unicode字符串,但使用'print'掩碼。除去'print'語句,它會顯示'u'[']字符串(當然是在Python 2.x中)。 –