我有一個大的日誌文件,我需要從中提取文件名。如何在文本文件中的第一個空格之後刪除每行中的所有字符?
文件看起來是這樣的:
/path/to/loremIpsumDolor.sit /more/text/here/notAlways/theSame/here
/path/to/anotherFile.ext /more/text/here/differentText/here
.... about 10 million times
我需要提取這樣的文件名:
loremIpsumDolor.sit
anotherFile.ext
我想,我的第一個策略是找到/替換所有/path/to/
'。但我堅持如何刪除空間後的所有字符。
你能幫忙嗎?
嗯......正則表達式的第一個空格後剝離?不會期望從你那裏;-) –
蠻力'sed'行動;我喜歡。 Windows默認情況下不提供諸如sed,grep,awk等強大的文本處理工具是一種遺憾。這些是系統管理員(IMHO)的麪包工具。 – Will
我不喜歡'cut',因爲它的標準([POSIX](http://pubs.opengroup.org/onlinepubs/9699919799/utilities/cut.html))版本不處理字段之間的一個或多個分隔符; GNU'cut'具有必要的'-i'選項,但我不能總是依靠GNU'cut'。當然,這不是一個特定任務的問題,但如果你不使用工具,因爲它不總是工作,你不使用它。我發現'sed'更易於使用,但是有多種工具可以使用('awk','perl','python''都可以很容易地使用,但是它們比所需的更復雜。 –