2016-02-09 42 views
0

我想所有的文本複製標記之間的網站:如何在2個html標籤之間複製文本?

<p> and </p>

使用bash。 你有一個想法如何做到這一點?

+3

不要這樣做。而是使用HTML解析器。 – SLaks

+0

使用XML/HTML解析器(xmlstarlet,xmllint,...)。 – Cyrus

+0

您是否希望從HTML頁面中獲取文本,或者是否希望通過填充模板html頁面中'

'和'

'之間的空格以及其他字符串來製作HTML頁面? –

回答

0

正如上面的評論所述:甚至不要嘗試。沒有可靠的方法來解析與Bash內部的HTML。 但是,當您使用shell時,您可能會使用第三方命令行工具,如pup,它們是在命令行上爲HTML解析而構建的。

0

是的,HTML解析器是更好的選擇。但是,如果你只是想快速搶在第一組的P標籤之間的文本,你可以使用Perl:

perl -n0e 'if (/<p>(.*?)<\/p>/s) { print $1; }' 

例如:

echo " 
<p>A test 
here 
today</p> 
<p>whatever</p> 
" | perl -n0e 'if (/<p>(.*?)<\/p>/s) { print $1; }' 

這將輸出:

A test 
here 
today 
相關問題