後,我有我想將它拆分成1000個記錄塊一個XML文件,該文件〜1GB大,與拆分XML文件轉換成塊標記
grep -c "</record>')," file
238613
,但每個文件需要與
結束</record>'),
然後我會得到238個文件。
這是與前兩個記錄的實際文件:
\set bib_tag '''IMPORT CONCERTO'''
INSERT INTO marcxml_import (tag, marc) VALUES
(:bib_tag,'<record xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
<datafield and subfield data>
</record>'),
(:bib_tag,'<record xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
<datafield and subfield data>
</record>'),
更好地使用Python – MLSC
請張貼樣本的數據。如果它很敏感,那麼補充一些東西。 –
dive in(http://docs.python.org/3/library/xml.etree.elementtree.html) – MLSC