2014-10-05 43 views
0

提取信息,我想FS是< ......>在awk如何從HTML標籤

點是任何東西。所以,如果我已經讓我們說

<td width="50%" valign="top">System Hardware</td>

我想提取System Hardware。我已經嘗試了兩件事,但它不起作用。

  1. awk -F "\<([^>]+)\>" '{print $1}' test.txt
  2. awk -F "\<?*\>" '{print $1}' test.txt

在這兩種情況下,我什麼也沒得到

回答

2

你得到什麼,因爲你告訴awk將打印$ 1,它是該領域的第一個前場分隔器。你想要print $2

$ awk -F'<[^>]+>' '{print $2}' file 
System Hardware