需要從CSV文件中提取URL -IGLP或FINDSTR

我正在尋找一行GREP或FINDSTR腳本，它將掃描一個完整的4列CSV文件的文件夾，並僅提取URLS並將其輸出到文本文件中，每行一個URL。該網址的格式爲「http://example.com/」我一直在玩這個劇本，但我似乎無法得到它的輸出任何東西需要從CSV文件中提取URL -IGLP或FINDSTR

cat filename | grep http | grep -shoP 'http.*?[" >]' > outfilename

來源

2014-09-19 Jim Stevenson

你可以試試這個：

find BASEDIR -type f -exec grep -oP "\bhttp://[^/]*/" {} \; > OUTFILE

這是不需要BASEDIR下的文件是CSV文件。

編輯

如果你想完整的URL（而不是在格式 'http://example.com/'，而是 'http://example.com/path'），並假設CSV分隔符是 ';'，然後

find BASEDIR -type f -exec grep -oP "\bhttp://[^;]*" {} \; > OUTFILE

來源

2014-09-19 15:25:10

正則表達式問，只提取域名而不是完整的URL。 – syme 2014-09-20 14:52:05

需要從CSV文件中提取URL -IGLP或FINDSTR

回答

相關問題