特定字符串(也不行),我有一個文本文件中兩行的文本文件:刪除從文本文件蟒蛇
<BLAHBLAH>483920349<FOOFOO>
<BLAHBLAH>4493<FOOFOO>
那是在文本文件中的唯一的事。使用python,我想寫入文本文件,這樣我就可以從每行刪除BLAHBLAH和FOOFOO。這似乎是一個簡單的任務,但刷新我的文件操作後,我似乎找不到辦法做到這一點。 非常感謝幫助:)
謝謝!
特定字符串(也不行),我有一個文本文件中兩行的文本文件:刪除從文本文件蟒蛇
<BLAHBLAH>483920349<FOOFOO>
<BLAHBLAH>4493<FOOFOO>
那是在文本文件中的唯一的事。使用python,我想寫入文本文件,這樣我就可以從每行刪除BLAHBLAH和FOOFOO。這似乎是一個簡單的任務,但刷新我的文件操作後,我似乎找不到辦法做到這一點。 非常感謝幫助:)
謝謝!
如果它是一個文本文件,就像你說的,而不是HTML/XML /別的東西,只是用replace:
for line in infile.readlines():
cleaned_line = line.replace("BLAHBLAH","")
cleaned_line = cleaned_line.replace("FOOFOO","")
寫cleaned_line
到一個輸出文件。
f = open(path_to_file, "w+")
f.write(f.read().replace("<BLAHBLAH>","").replace("<FOOFOO>",""))
f.close()
更新(保存到另一個文件):
f = open(path_to_input_file, "r")
output = open(path_to_output_file, "w")
output.write(f.read().replace("<BLAHBLAH>","").replace("<FOOFOO>",""))
f.close()
output.close()
考慮正則表達式模塊重。
result_text = re.sub('<(.|\n)*?>',replacement_text,source_text)
內<和>琴絃被識別。它是非貪婪的,即它將接受最小可能長度的子串。例如,如果你有「< 1>文本< 2>詳細文本」,貪婪的解析器將採取「< 1>文本< 2>」,但非貪婪解析器發生在「< 1> 「和」< 2>「。
當然,您的replacement_text是'',source_text是文件中的每一行。
該文件是否真的** XML?或HTML?還是XHTML?如果是這樣,請**更新**的問題是更具體的文件**真**看起來像什麼。如果文件符合任何標準,則有簡單的方法可以做到這一點。 –
你能告訴我們至少你有什麼試過嗎? – utdemir