2017-04-24 39 views
-5

我需要編寫一個正則表達式來掃描維基百科中文章的html代碼(字符串),以便鏈接到維基百科中的其他文章。如何在c#中編寫正則表達式以匹配維基百科中的文章的內部鏈接?

的聯繫通常看起來像這樣的例子:

<a href="/wiki/English Language" title="English Language">English</a>

<a href="/wiki/Spanish Language" title="Spanish Language">Spanish</a> 

我想正則表達式:"<a.*href=(\"|')(.+?)(\"|')*wiki.*>" 它的工作原理,但它也匹配圖片鏈接,而不僅僅是文章。

+1

1.你試過什麼? 2. *爲什麼*你想使用正則表達式呢? – UnholySheep

+0

請參閱http://stackoverflow.com/a/31805829/ – user326608

+0

[獲取html頁面上的所有鏈接?](http://stackoverflow.com/questions/2248411/get-all-links-on-html-頁) – csharpbd

回答

0

我終於成功了。我寫了一個鏈接開頭的正則表達式:

(@"<a href=""/wiki/[A-Z][A-Za-z0-9\-\-_]+""") 
相關問題