總結我的代碼:簡單的HTML DOM,如何從錨文本呼應只有文字
foreach($html->find('a') as $element) {
.. 我使用的內部文本此:
$element->innertext
這是任何機會回聲只錨文本unsing簡單的HTML DOM的文本,我嘗試爬行約10k鏈接,但在某些情況下,它打印IF是<a tag
,divs代碼,圖像代碼等
如果<a tag
是標準的(簡單),如:
<a href="http://www.test.com">Anchor Text</a>
所以在這種情況下,$元素 - >的innerText將是 「錨文本」 如果
但
的情況下,像這樣的:
1 <a href="http://www.test.com"><div id=whatever>Anchor Text</div></a>
或
2 <a href="http://www.test.com"><img src="whatever" /></a>
我$element->innertext
將是:
Result1 <div id=whatever>Anchor Text</div>
Result2 <img src="whatever" />
是否有任何變化只打印文本或者我應該寫我自己的自定義條件的每一種情況下:DIV,IMG等?
你不應該用'plaintext'屬性呢? – raina77ow