我正在使用簡單的HTML DOM解析器,並且我想完全忽略「嵌套」元素的內容並獲取正在進行的「pre」元素的內容。簡單的HTML DOM解析器 - 跳過某些元素
<div id=parent>
<div class="nested">
<pre>Text that I want ignored</pre>
</div>
<pre>
This is the text I want to access
</pre>
</div>
我沒有HTML源代碼的控制權,並且所有者最近添加了「嵌套」元素。在我訪問我需要的內容之前:
$page_contents = file_get_html($url);
$div_content = $page_contents->find('div[id=parent]pre', 0)->innertext;
但顯然新的嵌套元素已經破壞了我的方法。
我似乎無法找到任何有關這種情況下的官方文檔。
好吧,更新我的答案,我可以。 – user 2011-04-08 13:38:19
你爲什麼不編寫一個函數,在id爲「parent」的div的子元素之間迭代並忽略那些不是pre的子元素?迭代雖然這些孩子將繞過「我想忽略的文本」,因爲它不是母公司的孩子,雖然它們是間接相關的。 – PEdroArthur 2011-04-08 13:48:02