我有一個文件中的文檔列表。基本上由普通話和英文文件組成的TDT2語料庫。我只想保留英文文件並刪除普通話文件。手動這樣做會很長,因爲文件很大。在Python中刪除文件中的特定行
結構看起來是這樣的:
<ONTOPIC topicid=20001 level=YES docno=VOA19980630.1800.3165 fileid=19980630_1800_1900_VOA_ENG comments="NO">
<ONTOPIC topicid=20001 level=BRIEF docno=VOM19980220.0700.0559 fileid=19980220_0700_0800_VOA_MAN comments="NO">
<ONTOPIC topicid=20001 level=YES docno=VOM19980220.0700.1159 fileid=19980220_0700_0800_VOA_MAN comments="NO">
所以我想刪除它在他們的fileid一個「人」的文件。 如何在Python中執行此特定任務?
因此這些線是一個文件的內容,你想輸出中具有「ENG」行?如果我發佈了答案。 – garg10may