2012-01-30 89 views
1

我試圖使用grep獲取HTML文件中jpg圖像的完整url地址。一個問題是,其中沒有很多新行,所以當我使用grep時,它會得到路徑,但也有很多我不感興趣的其他東西。我怎樣才能獲得jpg圖像的url?從HTML文件獲取jpg圖像

+0

你能提供你的HTML的例子和當前'grep'命令? – olibre 2012-01-30 07:51:10

回答

10

一個單一sed命令

sed -n '/<img/s/.*src="\([^"]*\)".*/\1/p' yourfile.html 

一個單一grep命令

grep -o '<img[ ]*src="[^"]*"' yourfile.html 

兩個連續grep命令

grep -o '<img[ ]*src="[^"]*"' yourfile.html | grep -o '"[^"]*"' 

從網絡提議s-hunter

curl www.example.com/page.html | sed -n '/<img/s/.*src="([^"]*)".*/\1/p' 
+1

哇,令人印象深刻!需要多長時間才能拿出所有這些?你是從記憶中做到這一點的,還是你不得不查找的東西? – 2012-01-30 08:43:51

+0

我從記憶中做了。幾分鐘後,我想知道這是否正確。然後,我在我的電腦上測試過,看到'sed'命令是正確的。但是,我沒有測試過'grep' ...應該對於一些不起眼的JavaScript代碼來說是一樣的,不是嗎? – olibre 2012-01-30 09:16:27

+1

第一條命令是我所需要的。其他人稍微偏離。不過,我留下了深刻的印象。您需要多長時間才能熟練使用sed?我們可以成爲Facebook的朋友嗎? – 2012-01-30 09:19:05