-1
我需要在一個目錄(我已經創建了一個帶有glob的語料庫)中用xml標記解析txt文件,但etree解析一次只允許一個文件。如何設置一個循環來一次解析所有文件?目標是使用請求將這些文件添加到Elasticsearch。這是我迄今爲止:解析整個目錄Etree Parse lxml
import json
import os
import re
from lxml import etree
import xmltodict
import glob
corpus=glob.glob('path/*.txt')
ns=dict(tei="http://www.tei-c.org/ns/1.0")
tree = etree.ElementTree(file='path/file.txt')
doc = {
"author": tree.xpath('//tei:author/text()', namespaces=ns)[0],
"title": tree.xpath('//tei:title/text()', namespaces=ns)[0],
"content": "".join(tree.xpath('//tei:text/text()', namespaces=ns))
}
你問如何寫一個for循環? –