2014-01-09 99 views
-1

我有一個包含URL的文本文件。如何使用www和非www來刪除重複的地址? 比如我有兩個URL:如何刪除包含相似重複項的行?

example.com 
www.example.com 

我想刪除一個,或從www.example.com刪除「example.com」,那麼我可以刪除所有WWW的

文件包含約8k的網址,所以我不能這樣做手動

Url用新行分隔,或以某種方式用PHP來做,爆炸每個數組然後比較? (這將花費很多時間)

+0

如果你知道PHP,你應該忘記記事本++,並在PHP中執行它。它一定更容易。 – aalku

+0

我認爲一個PHP正則表達式可以做到這一點。 –

+0

[Regex:Remove lines contains]的可能重複(http://stackoverflow.com/questions/5876296/regex-remove-lines-containing) –

回答