我知道這對你們其中一位專家來說真的很容易!Bash腳本修復域名列表
我有一個這樣的名單:
www.google.com
ebay.com
yahoo.com
www.bing.com
www.buy.com
woot.com
news.google.com
images.google.com
我試圖寫一個bash/SED/awk腳本來清理這個名單。 我需要的列表看起來像這樣:
www.google.com
www.ebay.com
www.yahoo.com
www.bing.com
www.buy.com
www.woot.com
news.google.com
images.google.com
在它需要添加摘要「WWW」。如果它還沒有www或一個子域。該列表位於名爲theList的文件中。我跛腳的嘗試是這樣的:
sed 's/^www\./' theList > cleanedList
這顯然不適合在那裏已經有WWW或子域的情況下工作。 任何想法,將不勝感激。
謝謝!
EV
你用'foo.co.uk'做什麼?它需要一個'www',但你怎麼知道? –
@DennisWilliamson這是一個有效的問題,但它不是語料庫的一部分。這就是爲什麼我發表了很多意見徵詢的原因:並非每個解決方案都需要涵蓋每個用例。有時候「快速和骯髒」是足夠好的。 :) –
@CodeGnome:沒錯,沒有列出這樣的例子。但是,*我們*不知道實際數據中是否可能存在類似的數據。這就是爲什麼*我*發表評論詢問它。這可能是因爲OP沒有意識到解析域名是一個難題,因此沒有想到發佈更多的例子。 –