請注意,我有一些Python體驗,但沒有很多深入的體驗,請耐心等待。從Python中提取XML部分
我有一個非常大的XML文件,約100兆,有許多,許多部分和小節。我需要抽出某個類型的每個子類(並且這個類型有很多),並將每個子類寫入一個不同的文件。我可以處理的寫作,但是我盯着ElementTree文檔試圖理解如何遍歷樹,找到一個以這種方式聲明的元素,將這些標記之間的數據抽出並處理它,然後繼續下去。
結構與此類似(稍微模糊)。我想要做的是分別標出每個標有「數據」的部分。
<filename>
<config>
<collections>
<datas>
<data>
...
</data>
<data>
...
</data>
<data>
...
</data>
</datas>
</collections>
</config>
</filename>