我是xpath的新手,請耐心等待。目前,我正在尋找使用scrapy刮一些內容了一些網頁,內容看起來是這樣的: <td colspan="3" valign="top" class="regular">Landsize: 84,000sq with an extensive shoreline 750m<br />
<br />
Call Or Email for more info<br /
有沒有一種方法可以從HTML字符串中檢索所有純文本節點的數組?我想它來檢索「嵌套」獨立地元件,因此像這樣的字符串: <p>This is a <b>nested <i>HTML</i> tag<b>...</p>
將被檢索爲This is a,nested,HTML,tag,和...爲單獨的元件。 谷歌搜索,並因此搜索使我拼湊這混亂的代碼: $doc = new DOMDocument();