2013-09-27 114 views
0

有沒有一種方法可以獲得html頁面的主體,而不需要html標籤?沒有HTML標籤的wget

curl和wget返回響應,但包含HTML標籤。我們可以使用sed和awk去除標籤,但是我正在尋找一種現有的工具,它可以在沒有sed和awk的情況下完成。

lynx是一個選項,但它沒有預先安裝。

謝謝!

回答

1

爲什麼厭惡安裝合適的工具?

作爲l alternative的替代品,嘗試w3m,例如,

w3m -dump http://google.com 
+1

我對安裝工具沒有反感。在安裝任何其他軟件包之前,只需要知道是否有現有的工具 – shan