2009-10-05 12 views
2

我想使用簡單的HTML DOM來提取標籤內的類與「sitepoint」的一切。這裏是我的代碼無法正常工作:卡住簡單的Html Dom和提取信息

<?php 
include_once('simple_html_dom.php'); 

$html = file_get_html('examplewebsite'); 
$ret = $html->find('.sitepoint'); 
echo $ret; 

?> 

下面是sitepoint標籤之一的例子(有十個左右)裏面,我想要的信息。

<dl class="sitepoint"> 
<dd class="thumbnail"> 
<a href="blabla" ></a><a href="/toolbar/sidepanel.php?url=random.html" >Get This  Now</a> </dd><dt class="notext"><a href="/to/" >Title</a></dt><dd class="starts"> 
<table width="100%" cellpadding="0" cellspacing="0" border="0"> 
<tr><td class="textUncolor"> CUT OUT SOME IMAGES AND  ADDRESSES HERE 
          </td></tr> 
</table> 
</dd> 

誰能幫我得到它的工作?

+0

+1不嘗試使用正則表達式。 ;) – TrueWill 2009-10-05 21:42:10

回答

0

您需要訪問outertext屬性。

$html->find('.sitepoint',0)->outertext; 

查看docs瞭解更多信息。看在「魔法屬性」

編輯

在選擇類,你需要指定哪一個您使用在文檔中。我改變了上面的例子來反映這一點。這是測試和工作。 (注意0作爲第二個參數查找)

+0

你好,我改行 $ html-> find('。sitepoint') - > outertext; 它沒有工作。 – 2009-10-05 21:38:20

+0

html關閉

標記嗎? – 2009-10-05 21:42:48

+0

啊我一定已經把標籤拿出來了,它在html中關閉了。 Btw在文檔中有幾個

標籤。 如果有人能告訴我我在哪裏出錯,我將不勝感激。 – 2009-10-05 22:26:19