我有一個解析一些XML的腳本。 XML包含:如何使用regexp + Python從XML中獲取指定標記屬性的值?
<SD TITLE="A" FLAGS="" HOST="9511.com">
<TITLE TEXT="9511 domain"/>
<ADDR STREET="Pmb#400, San Pablo Ave" CITY="Berkeley" STATE="CA" COUNTRY="US"/>
<CREATED DATE="13-Oct-1990" DAY="13" MONTH="10" YEAR="1990"/>
<OWNER NAME="9511.Org Domain Name Proxy Agents"/>
<EMAIL ADDR="[email protected]"/><LANG LEX="en" CODE="us-ascii"/>
<LINKSIN NUM="75"/><SPEED TEXT="3158" PCT="17"/>
<CHILD SRATING="0"/>
</SD>
<SD>
<POPULARITY URL="9511.com/" TEXT="1417678" SOURCE="panel"/>
</SD>
如何獲得 'TEXT' 屬性標記的值(在我的情況1417678)?我正在使用正則表達式+ Python。正則表達式字符串:
my_value = re.findall("POPULARITY[^\d]*(\d+)", xml)
它得到我'9511',但我需要'1417678'。
請使用XML解析器。 Python默認應該有xml模塊,如果你不喜歡它,還有其他類似的模塊可以安裝。 – nhahtdh 2013-02-28 07:42:30
它更容易,謝謝。我只想知道如何修復我的正則表達式。 – 2013-02-28 07:55:49