0
我之前做過網頁抓取,但它從來沒有這麼複雜。我想抓取iframe中的參數值。xpath - 抓取內部數據
例如代碼:
<iframe width="100%" scrolling="no" height="320px" frameborder="0" src="http://carriers.993low.com/fqoyJxxS.php">
<object id="player" width="100%" height="100%" type="application/x-shockwave-flash" data="http://merhad.333low.com/player.swf" bgcolor="#000000" name="player" tabindex="0">
<param name="allowfullscreen" value="true">
<param name="allowscriptaccess" value="always">
<param name="seamlesstabbing" value="true">
<param name="wmode" value="opaque">
<param name="flashvars" value="http://merhad.333low.com/fqoyJxxS-2c2MSx-wGYmS3T1pkggIeiK7wpA7BbXXcK2sC4XYWehpBDV6CAK7CFH/s=awcmxqt5gYntLqHJ9ceP.flv">
</object>
</iframe>
我想返回是使用XPath在對象內部的參數的時值。
iframe是一個節點一樣的任何其他,所以是對象,和它的參數。只是因爲HTML使它們變得神奇,並不意味着它們超過了正常的標記。 –
'iframe/object/param' –
$ xpath2-> query(「// iframe/object/param [@ name ='flashvars']/@ value」) - > item(0) - > nodeValue –