我有相當數量的圖像搜索結果,我想要將其轉換爲相當數量的實際圖像。提取與reg exp
所有的結果都是單個圖像的HTML頁面,並且每個文件包含子
<標題>谷歌 - Ergebnis毛皮[URI] </TITLE>
其中[URI]表示實際結果圖像的絕對URI(http:// ...(.gif | .jpg | .jpeg | .bmp))。
但我不明白如何提取uri將其交給wget。
cat imgres.html | grep「< title>」| SED的/ <標題>谷歌 - 獻給Ergebnis HTTP:(。*)// </TITLE>/\\ 1 /'
我不知道很多關於'sed',但無論是在'HTTP://'和''你使用'/'這也是你的正則表達式的分隔符 - 你可以做到這一點?難道你不應該將它們作爲'http:\/\ /'和'<\/title>'來轉義嗎? – h2ooooooo