如何從這個HTML代碼中提取:我怎麼能與<br>分隔符提取文本?
<body>
<div class="div1">
<div class="div2">
<div class="div3">
<div class="div3.1">
<h2 class="notopgap">HEADER</h2>
<br>DONT WANT THIS TEXT
<br><a href='mailto:[email protected]'>[email protected]</a>
<br><h2>I WANT THIS TEXT</h2>
<br>TEXT: WANT THIS
<br>DONT WANT THIS
<a name='#lev3'></a>
<h2>FINALLY I WANT THIS TOO</h2><br>
<div class="div3.1.1">
BUNCH OF TEXT ...
以下文字:
WANT THIS TEXT
WANT THIS
FINALLY I WANT THIS TOO
與引入nokogiri /紅寶石?
我的div與其他元素只BR的提取,但我怎麼能做到這一點的時候有我想要的文本的每個部分之間沒有div但?
你要的是什麼區別,你做什麼呢?特別是什麼決定你想要「TEXT:想要這個」,但不是「不想要這個」? –
什麼區別是
TEXT:...直到下次
! – Fakada
所以你想要的文字後面是「
」,但不是「*」後面跟着「
」的文字? –