2013-10-07 19 views
0

我需要提取從HTML頁面,看起來數據,如:如何提取值的HTML表單一節中PHP

<li> 
    <h2> 
     <a href="/rss/Football/actu_rss_35.xml" target="_blank" class="rss"><span>rss</span></a>AC Ajaccio</h2> 
    <div class="club-left"> 
     <a href="/Football/FootballFicheClub35.html" title="AC Ajaccio"><img src="http://medias.lequipe.fr/logo-football/35/60?CCH-13-40" width="60" height="60"></a> 
    </div> 
    <div class="club-right"> 
     <ul class="club-links"> 
      <li><span class="plus"></span> 
       <a href="/Football/FootballFicheClub35.html">Fiche club </a> 
      </li> 
      <li><span class="plus"></span> 
       <a href="/Football/FootballFicheClub35.html#Calendrier">Calendrier</a> 
      </li> 
      <li><span class="plus"></span><a href="/Football/FootballFicheClub35.html#Effectif">Effectif</a> 
      </li> 
      <li><span class="plus"></span> 
       <a href="/Football/FootballFicheClub35.html#Joueurs">Stats joueurs</a> 
      </li> 
      <li><span class="plus"></span> 
       <a href="/Football/FootballFicheClub35.html#Statistiques">Stats club</a> 
      </li> 
     </ul> 
    </div> 
    <div class="clubt hidden">35</div> 
    <div class="clear"></div> 
</li> 

我想在PHP中提取href值,這部分的文字:

<a href="**/Football/FootballFicheClub35.html#Joueurs**">**Stats joueurs**</a> 

我用下面的代碼,但有若有所失:

$elements = $xpath->query("//div[@id='Base']/ul/li"); 
if (!is_null($elements)) { 
    foreach ($elements as $element) { 
    $nodes = $element->childNodes; 
    foreach ($nodes as $node) { 
     if($node->nodeName!='#text'){ 
      echo $node->nodeValue.";<br/>"; 
      $stringData = trim($node->nodeValue).";"; 
     } 
    } 
} 
+0

什麼是你得到當前的結果? –

+0

rssAC阿雅克肖; ; Fiche俱樂部CalendrierEffectif統計joueursStats俱樂部; 35; ; –

回答

1

UPDATE:

嘗試:

$elements = $xpath->query("//ul[@class='club-links']//a"); 
foreach ($elements as $element) { 
    echo $element->nodeValue." - ".$element->getAttribute("href")."<br/>"; 
} 
+0

謝謝。是的,它效果更好,但我需要也有H2元素的價值(AC Ajaccio在這種情況下)。 –

+0

我認爲我需要分兩步進行治療。首先提取h2元素的值,然後確切地確定a的值和屬性 –