2012-05-05 17 views
0

我有一個鏈接列表,但我需要FILTER-OUT和從字符串中提取正確的鏈接。從包含它們的字符串獲取鏈接的最佳方式

提取物應當與mywebsite.com開始和結束與9- digitnumber.html 鏈接是字符串,提取以字符串

http://blah.com?f=www.mywebsite.com/sdfsf/sdfsdf/sdfsdfsdf/123456789.html&sdfsdf/sf/sdfsd8sdfsdfsdf 

等等...

由此,正則表達式必須提取

mywebsite.com/sdfsf/sdfsdf/sdfsdfsdf/123456789.html 

這個s應該與末尾 '@「[0-9] {9}」中的數字匹配「。但我對正則表達式很陌生,並試圖學習如何正確使用它

+0

它必須是一個正則表達式嗎?數據的來源是什麼?你有更多的例子嗎? – Oded

+0

此外 - [你有什麼嘗試](http://whathaveyoutried.com)? – Oded

+0

正則表達式不是必需的 – Andrew

回答

1

用正則表達式解析HTML通常是一個壞主意。對於你具體的例子,你可以使用:

(mywebsite.com/(.+?)\d{9}) 

但安德魯說,使用正則表達式做你想要的是不是真的有必要。

+0

lnk = Regex.Match(val,@「mywebsite.com /(。+?)\ d {9}」)。ToString();成功了! – Andrew

1
/mywebsite\.com\/[a-zA-Z0-9\/]*[0-9]{9}\.html/ 
+0

我試過'String lnk = Regex.Match(val,@「/ mysite \ .com \/[a-zA-Z0-9 \ /] * [0-9] {9} \。html /」)。ToString ();'它不起作用 – Andrew

+0

@Andrew我對C#一無所知,但是嘗試了'String lnk = Regex.Match(val,@「mywebsite \ .com \/[a-zA-Z0-9 \ /] * [0-9] {9} \。html「)。ToString();' – Tyilo

+0

@Andrew \t你也可以輸入'mysite'而不是'mywebsite',這可能是問題所在。 – Tyilo

相關問題