在一個巨大的文本文件中,爲了提高效率(我不逐行讀取文件),我將其處理爲一個大字符串,我想刪除任何在-swf之前和之後的字符。Python正則表達式替換匹配文本
我有一個看起來像這樣一個巨大的文字:
bla bla bla ||NULL||abc-swf||NULL||NULL
bla bla bla ||NULL||cdacda-swfend%23wrapclass||NULL||NULL
bla bla bla ||NULL||bgdbgdbgd-swf%28ML%29endBeliefnet.Web.UI.S||NULL||NULL
我想最後的結果是這樣的:
bla bla bla ||NULL||abc-swf||NULL||NULL
bla bla bla ||NULL||cdacda-swf||NULL||NULL
bla bla bla ||NULL||bgdbgdbgd-swf||NULL||NULL
我可以通過線使用分區函數做這行python,但它需要很長時間,因爲它需要逐行處理文件,並且該文件具有超過10M行。有沒有辦法通過不逐行檢查文件來做到這一點?
您的問題與問題標題無關。我會推薦重寫它,指的是使用正則表達式來替換大文本文件中的文本。 – aldux