2015-10-01 161 views
-1

我的URL列表如下:提取父域/子域名

http://example.com/sdfsdf/sdfsa 
https://example2.com/53lasfd/asdfs 
http://www.example3.com/asdfas/asdfasdf.php?=asdfa 
https://subdomain.example4.com/index.php?id=sadfa 
https://www.subdomain.example5.com/asdfas/asdfasd 

我需要在不http只提取域(和子域),httpswww和所有/後:

exmaple.com 
exmaple2.com 
example3.com 
subdomain.example4.com 
subdomain.example5.com 
+0

對不起,輸出應該是在每一個新行 –

回答

2

您可以使用awk

awk -F/ '{sub(/^www\.?/,"",$3); print $3}' yourfile 

測試:

$ awk -F/ '{sub(/^www\.?/,"",$3); print $3}' yourfile 
example.com 
example2.com 
example3.com 
subdomain.example4.com 
subdomain.example5.com 
+0

正是我需要的!謝謝! –

+0

如果我不需要子域但只有域名會怎麼樣? –

+0

嘗試:'awk -F /'{sub(/^www \。?/,「」,$ 3);打印$ 3}'yourfile | awk -F \。 'NF == 2'' – sat