1
我使用的元素樹,比如伊夫這個XML代碼打印Python中兩個XML標記之間的內容?
<TEXT>
<PHRASE>
<CONJ>and</CONJ>
<V>came</V>
<en x='PERS'>Adam</en>
<PREP>from</PREP>
<en x='LOC'>Atlanta</en>
</PHRASE>
<PHRASE>
<en x='ORG'>Alpha</en>
<ADJ y='1'>Amazingly</ADJ>
<N>created by</N>
<en x='PERS'>John</en>
</PHRASE>
</TEXT>
我想是打印整個短語時,我有在ORG =「阿爾法」恩標籤和PERS =「約翰」在其他EN標籤,我想輸出爲
我知道如何尋找Alpha和約翰「阿爾法令人驚訝的是由約翰·創造」,但我的問題是印刷
之間有什麼在for phrase in root.findall('./PHRASE'):
ens = {en.get('x'): en.text for en in phrase.findall('en')}
if 'ORG' in ens and 'PERS' in ens:
if (ens["ORG"] =="Alpha" and ens["PERS"]=="John"):
print("ORG is: {}, PERS is: {} /".format(ens["ORG"], ens["PERS"]))
但是如何在該短語中打印標籤文本的其餘部分。
[這可能是相關的(http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained -tags/1732454#1732454)或試着看[BeautifulSoup](http://www.crummy.com/software/BeautifulSoup/) – javanut13