我試圖清理日誌,我想刪除一些特殊字符串如何使用Python中的正則表達式使用特殊字符串刪除字符?
例子:
%/h > %/h Current value over threshold value
Pg/S > Pg/S Current value over threshold value
Pg/S > Pg/S No. of pages paged in exceeds threshold
MB < MB min. avg. value over threshold value
我曾嘗試使用一些模式,但它似乎沒有工作。
re.sub(r'\w\w\/\s>\s\w','',text)
有沒有什麼好主意讓我去除特殊模式?
我想刪除了.../...> .../...
我希望我的輸出只包含有用的話。
Current value over threshold value
No. of pages paged in exceeds threshold
min. avg. value over threshold value
謝謝你的任何想法!
是內容之前和之後的'>'總是一樣的?匹配'^([^ \ s>] *)\ s +> \ s + \ 1'會是我的想法。 –
它總是以這種方式分開。換句話說,感興趣的字符串總是會在第三個空格之後出現嗎? – idjaw