2012-06-22 45 views
0

搶文字我有以下HTML片段:快速的正則表達式的幫助:從HTML

<h1 class="header" itemprop="name">Some text here<span class="nobr"> 

我想獲得的HTML標籤之間的文本,我現在有了這個掙扎小時,請幫幫我!什麼正則表達式可以解決我的問題?

+3

正則表達式不應該用於HTML解析。使用解析器。 –

+0

[通常它不能完成。](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)但你可以嘗試' <[^>] *>([^ <]*)<.*>' – Beta

回答

0

你不應該使用正則表達式,但一些HTML解析器。當你沒有指定的語言,這是很難幫助,但你會通過在google找到它...


如果你需要它只是爲這一個情況下,你可以使用正則表達式/>(.*?)</

+0

那個正則表達式不起作用 –

+0

@ m.edmondson - 是的,它的確如此:http://ideone.com/d8kl1 –

+0

好吧 - 我使用的是C#引擎,它沒有 –

0

在Javascript中,你可以通過訪問這些信息:

document.getElementsByTagName("h1").item(0).textContent 

document.getElementsByClassName("header").item(0).textContent 
0

像其他的含有S aid - 你不應該使用正則表達式來解析HTML。但是,除了下面將抓住該文本爲您提供:

(?<=\>).+(?=\<)