我有一個包含URL的文本文件。如何使用www和非www來刪除重複的地址? 比如我有兩個URL:如何刪除包含相似重複項的行?
example.com
www.example.com
我想刪除一個,或從www.example.com刪除「example.com」,那麼我可以刪除所有WWW的
文件包含約8k的網址,所以我不能這樣做手動
Url用新行分隔,或以某種方式用PHP來做,爆炸每個數組然後比較? (這將花費很多時間)
我有一個包含URL的文本文件。如何使用www和非www來刪除重複的地址? 比如我有兩個URL:如何刪除包含相似重複項的行?
example.com
www.example.com
我想刪除一個,或從www.example.com刪除「example.com」,那麼我可以刪除所有WWW的
文件包含約8k的網址,所以我不能這樣做手動
Url用新行分隔,或以某種方式用PHP來做,爆炸每個數組然後比較? (這將花費很多時間)
在Notepad ++中搜索「www。」然後用空格替換全部。然後使用array_unique()
我已經先刪除了所有的www。 - >更換所有www。到'' 然後刪除重複: Regex: Remove lines containing
您應該將其標記爲已接受。 –
*您可以在兩天內接受您自己的答案 – user2606353
如果你知道PHP,你應該忘記記事本++,並在PHP中執行它。它一定更容易。 – aalku
我認爲一個PHP正則表達式可以做到這一點。 –
[Regex:Remove lines contains]的可能重複(http://stackoverflow.com/questions/5876296/regex-remove-lines-containing) –