我有一個索引HTML文件與文件/目錄列表。它只是一個像通常的文件瀏覽器:bash命令來匹配n行
...content here...
<td><a href="20130011/">20120011/</a></td>
<td><a href="20130111/">20120111/</a></td>
<td><a href="20130211/">20120211/</a></td>
<td><a href="20130411/">20120411/</a></td>
...content here...
我不明白如何從底部提取第二行。
1)我下載HTML,捲曲
content=$(curl -sL "http://path-to-html")
2)然後使用
dir=$(echo $content | sed '/.*href="\([0-9]*\/\)".*/!d;s//\1/;q')
這給了我最後一場比賽:20120411
。
但是如何獲得前一個?
我不知道項目的總數。
無法理解這對我的情況有何幫助。正則表達式和打印pre-last匹配... –
我已經上傳了tmp文件,嘗試它,不工作'dir = $(curl -sL「http://www.arteetmarte.no/tmp/index.html」| awk -F''''{pen = ult; ult = $ 2} END {print pen}')' –
@DmitriA:由於您的數據與問題中的數據看起來如此不同,我已經更新了我的答案。 – Johnsyweb