我試圖解析通過html源代碼。在我的例子中,我只是在迴應它。但是,我正在練習中從文件中讀取html。字段分隔符 - 麻煩分隔命令字符
下面是一些代碼,工程,語法:
echo "<td>Here</td> some dynamic text to ignore <garbage> is a string</table>more junk" |
awk -v FS="(<td>|</td>|<garbage>|</table>)" '{print $2, $4}'
在FS聲明
我創建4個分隔符,其做工精細,和我輸出2和第4場。
然而,第三場定界符我真正需要使用包含awk命令字,從字面上:
')">
,這樣當我改變上述聲明:
echo "<td>Here</td> some dynamic text to ignore ')\"> is a string</table>more junk" |
awk -v FS="(<td>|</td>|')\">|</table>)" '{print $2, $4}'
我試着將冒犯的字符串與\字符的一個,全部和每個組合進行轉義。但是,沒有任何工作。
命令的預期輸出不起作用是什麼? –
@Ed Morton的第一位代碼返回預期的輸出。第二個不是。已經將您的其他答覆標記爲解決方案。謝謝。 – James
確定,但下次 - 實際顯示您的問題的預期輸出。 –