2013-01-24 56 views
0

颳去urllist只有根域我想正則表達式代碼只刮帶.com之後所有子文件夾或任何.com域名。正則表達式 - 在網頁

例如: 上的網址我想刮http://www.google.comhttp://www.yahoo.com列表的網頁,但不http://www.google.com/hello.htmlhttp://www.yahoo.com/news/

+0

http://regexlib.com – keeg

+0

此外,[8正則表達式,你應該知道(http://net.tutsplus.com/tutorials/other/8-regular-expressions-you-should-know/) – JDB

+1

從正則表達式的標籤說明:*請還包括標籤指定程序ming您正在使用的語言或工具。* – JDB

回答

1

試試這個:

(https?:\/\/)?www.[a-zA-Z0-9-]+\.[^/\s]*