我有一個包含數據的數據文件一樣如何從HTML中提取屬性和文本?
<li class="speaker_index js_only" id="si_4178514"
data-si_id="4178514" data-speaker_id="20864"
data-start_offset="9"
data-end_offset="125">
<h5>
<span class="icon-user">speaker: </span>James Brown
<span class="item_time"><span class="icon-time" title="time">, time: </span>00:01:56</span>
</h5>
<p>The chairman opens the meeting</p>
</li>
我會處理這種數據檢索下面
start=9
end=125
speaker=James Brown
text=The chairman opens the meeting
我可以尋找各種符號和提取我需要的數據結果,但我想這可以做很多結構化和一般的方式(可能通過使用正則表達式?)。
最好的辦法是創建一個對象數組(每個對象都有鍵start
,end
,speaker
,text
)。
什麼是使用JavaScript實現我的目標的最好和最簡單的方法?
不要使用正則表達式。請使用DOM。 – 2014-09-06 18:36:39
如果它總是格式良好的html,你可以嘗試將它轉換爲xml並對其進行xpath搜索。 – Rhumborl 2014-09-06 18:36:48