我想弄清楚在Perl中使用HTML :: TreeBuilder從XML文件中的某些HTML中提取幾段文本的最佳方法。在perl中用HTML定位div :: TreeBuilder
我讓它使用$tree->address
(或者我認爲)工作,直到我意識到並非所有條目都是以相同的順序。
沒有經過列表中的每一項,看起來每個條目都有幾個<div>
元素,但其中只有一個<div>
的元素有<p>
個元素。並且<div>
都沒有課程,這將使這很容易。
我已經嘗試了幾種不同的方式,所以沒有任何東西似乎能工作,我可以在其中提取我想要的文本。我看了幾個不同的例子,但他們中沒有一個真的非常接近我所尋找的。
這將是很好,如果是這樣的工作:
$bodyText = $tree->look_down('_tag' => 'div' => 'p');
但是,這給我的錯誤:
param list to look_down ends in a key!
不管怎麼說,也許有人可以幫我指出正確的方向,我有一直在尋找整夜,現在我的大腦受傷了。
謝謝!
約翰
你可以添加一個HTML代碼片段嗎? – simbabque