2011-12-09 62 views
0

一個鏈接,我有一些長的HTML文本,像這樣的值:充分利用HTML文本

/*stuff*/ 
<a href="some/link.html">Link</a> 
/*stuff*/ 

我如何可以裁剪,這樣我只得到some/link.html文字?

+3

使用正則表達式[可能不是最好的策略(HTTP://計算器.com/q/1732348/464709)。也許你可以使用HTML解析器來代替? –

+1

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags(我總是引用這一個夢想,我的首選是'即使喬恩Skeet不能解析HTML使用常用表達' )。奇怪的是,我記得關於正則表達式的MSDN上的一個例子,我記得是關於提取鏈接... –

回答

-1

使用jQuery你可以做following

var pageNum = $("a#specificLink").attr("href").match(/page=([0-9]+)/)[1]; 

和.NET C#this tutorial可能會引導你在正確的方向。

+0

你ar向epointing在錯誤的方向:你提出的教程將匹配註釋中包含的鏈接,這是錯誤的。 –

+1

這不是一個jQuery,但C#問題 –

+0

@parapurarajkumar它並不意味着他不能使用jquery來實現相同的目的,我已經在c#中發佈了問題,但只要最終結果有效就接受任何解決方案。並且匹配m2 = Regex.Match(值,@「href = \」「(。*?)\」「」該教程中的那一行不起作用?這是一個閱讀不假設的問題。 – Andres

0
MatchCollection matches = Regex.Matches(html, @"(?<=<a\s+href="").*?(?="">)"); 

應該做的伎倆。

請注意,我使用的模式(?<=prefix)find(?=suffix)有:
PREFIX = <a\s+href="
發現= .*?
後綴= ">