2014-09-19 78 views
0

我正在尋找一行GREP或FINDSTR腳本,它將掃描一個完整的4列CSV文件的文件夾,並僅提取URLS並將其輸出到文本文件中,每行一個URL。該網址的格式爲「http://example.com/」我一直在玩這個劇本,但我似乎無法得到它的輸出任何東西需要從CSV文件中提取URL -IGLP或FINDSTR

cat filename | grep http | grep -shoP 'http.*?[" >]' > outfilename 

回答

0

你可以試試這個:

find BASEDIR -type f -exec grep -oP "\bhttp://[^/]*/" {} \; > OUTFILE 

這是不需要BASEDIR下的文件是CSV文件。

編輯

如果你想完整的URL(而不是在格式 'http://example.com/',而是 'http://example.com/path'),並假設CSV分隔符是 ';',然後

find BASEDIR -type f -exec grep -oP "\bhttp://[^;]*" {} \; > OUTFILE 
+0

正則表達式問,只提取域名而不是完整的URL。 – syme 2014-09-20 14:52:05