0
我在解析下面的xml文件時遇到了問題。這是我的嘗試;應用元素樹來分析複雜的xml結構
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<corpus name="P4P" version="1.0" lng="en" xmlns="http://clic.ub.edu/mbertran/formats/paraphrase-corpus"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://clic.ub.edu/mbertran/
formats/paraphrase-corpus http://clic.ub.edu/mbertran/formats/paraphrase-corpus.xsd">
<snippets>
<snippet id="16488" source_description="type:plagiarism;plagiarism_reference:00061;
offset:47727;length:182;source:P4P;wd_count:37">
All art is imitation of nature.
</snippet>
</snippets>
</corpus>
import xml.etree.ElementTree
#root=xml.etree.ElementTree.parse("C:\\Users\\P4P_corpus\\P4P_corpus_v1.xml").getroot()
source=root.findall('snippets/snippet')
for details in source.findall:
print details.get('source_description')
print details.findtext
我的輸出是空
我想要的輸出:
"type:plagiarism;plagiarism_reference:00061;
offset:47727;length:182;source:P4P;wd_count:37"
和All art is imitation of nature.
我會很感激你的建議離子。
我不相信你的輸出是空的代碼張貼。 snippets snipet至少會引發錯誤。 –
@MadPhysicist,對不起,我把斜槓錯了,我現在編輯這個問題。但是,這是我得到的結果。 – Boby