我有一個HTML字符串,它可能是這個樣子:PHP DOM:獲取所有文本值
<body>
<div>
<span class="blah">Monkey </span>
<p>breath really <b>stinks</b></p>
And I don't like it!
</div>
</body>
正如你可以看到,還有一些文字正確包含作爲元素中的值,有包含文本節點和其他元素的元素。我希望能夠得到所有文本值在body下(假設body是一個DOMElement,我已經存儲在一個變量中)。
因此,輸出看起來是這樣的:
猴breat真的很糟糕,我不喜歡它!
我該怎麼做? XPath的?正則表達式?魔法?
嘗試魔術,當它感覺,你使用JavaScript。 – Chibuzo 2012-04-06 02:01:30
@jwegner - 你爲什麼要這樣做?什麼是用例? – Flukey 2012-04-06 02:03:19
@Flukey類似於「鏈接密度」的討論[這裏](http://stackoverflow.com/questions/3652657/what-algorithm-does-readability-use-for-extracting-text-from-urls),我會喜歡計算一個HTML表格的密度 – jwegner 2012-04-06 12:08:19