2012-12-14 135 views
0

我想獲取div標籤的內容。 例如:如何使用正則表達式獲取div標籤內容

<div id="gameDetailsInner"> 
<div id="headerText" style="padding-left: 0px !important;padding-top: 0px !important;"> 
<h1><a href="http://www.abc.com/games.php?flash=7264">abc text</a></h1> 
</div> 
<div style="min-height: 90px;"> 
<a href="http://www.abc.com/games.php?param=12345"><img src="http://abc.abc.com/images/7264.jpg" alt="abc" width="120" height="78" id="gameDetailsInnerImg"/> 
</a> 
How can i get this text with regex? 
</div> 

謝謝...

+1

爲什麼你需要的正則表達式之前?你想解析一個靜態的HTML文檔嗎?如果是這樣,你在用什麼語言工作? –

+0

@AndyLester你可以,你不應該:) – Trufa

+0

是的我想解析一個靜態HTML文檔,我使用的是C#:\ –

回答

1

如果您在PHP的時候,你可以使用strip_tags()函數從字符串中刪除所有的HTML標籤。

不僅如此,您需要使用合適的HTML解析器。你不能用正則表達式解析HTML。您需要使用適當的HTML解析器。 http://htmlparsing.com列出了許多針對不同語言的解決方案。

+0

我正在使用c#:\ –

+0

@ÖzkanSelek我用c#標記標記了你的問題。 – Trufa

0
<div.*>([^>]+)</div> 

組別1給出了div的內容,如果內容是剛剛結束</div>

相關問題