如何刪除包含相似重複項的行？

-1

我有一個包含URL的文本文件。如何使用www和非www來刪除重複的地址？比如我有兩個URL：如何刪除包含相似重複項的行？

example.com 
www.example.com

我想刪除一個，或從www.example.com刪除「example.com」，那麼我可以刪除所有WWW的

文件包含約8k的網址，所以我不能這樣做手動

Url用新行分隔，或以某種方式用PHP來做，爆炸每個數組然後比較？（這將花費很多時間）

如果你知道PHP，你應該忘記記事本++，並在PHP中執行它。它一定更容易。 – aalku

我認爲一個PHP正則表達式可以做到這一點。 –

[Regex：Remove lines contains]的可能重複（http://stackoverflow.com/questions/5876296/regex-remove-lines-containing） –

在Notepad ++中搜索「www。」然後用空格替換全部。然後使用array_unique()

2014-01-09 11:56:26 andershagbard

我已經先刪除了所有的www。 - >更換所有www。到'' 然後刪除重複： Regex: Remove lines containing

2014-01-09 12:05:15 user2606353

您應該將其標記爲已接受。 –

*您可以在兩天內接受您自己的答案 – user2606353

回答