我想提取關鍵詞之間的列表的特定部分,這就是介於和之間的所有內容,而忽略其他所有內容。從關鍵詞之間的列表中提取特定的數據塊
['badsffsg\n', 'fssdfsdgdg\n''<begin data>\n', 'data\n', '<end data>\n', 'bagsdg\n', 'fsdgdg\n', '<begin data>\n', 'data\n', 'data\n', '<end data>\n' 'gsdg\n']
我有麻煩搞清楚如何在列表上進行迭代。我解決了一個類似的問題,但它是在字典中固定索引處只有一個數據塊的情況下。
def extract_person(lines, start_index=0):
start = start_index
end = lines.index('<end data>\n', start_index + 1)
mylist = []
for line in range(start + 1, end):
這次它是一個列表,有多個數據塊,它不確定數據從哪裏開始。它只是如何迭代這個,我需要一些建議。
你真的有看起來像標籤嗎?你是否奇怪地分離了一些xml/html標籤? –