2016-09-06 91 views
1

我希望使用awk從此表中提取數據,但是我無法獲得正確的輸出。表中的每一行看起來是這樣的:使用awk從html中提取數據

<tr> 
    <td class="center">4 
    </td> 
    <td>Bergkrystallen via Majorstuen 
    </td> 
    <td> 
    <img src='/Content/img/train2.png'/> 
    </td> 
    <td>18:55 
    </td> 
    <td class="center">1</td> 
</tr> 

我想這樣的:通過Majorstuen 18:55

我用awk試了4 Bergkrystallen,但我無法得到它的權利:

file.html | awk -F "</?td.*>" '/<\/?td.*>.*/ {print $2 }' 

回答

1

嘗試:

awk -F "</?td.*>" '/<\/?td.*>.*/ {printf "%s ",$2 } END {printf "\n"}' 

注 - 可能只如果你的HTML源代碼是一致的作品...

:)
Dale