我試圖解析HTML文件,對該格式的字符串:C#正則表達式 - 如何解析字符串的瑞典字母åäöÅÄÖ?
<a href="/userinfo/userinfo.aspx?ID=305157" target="main">MyUsername</a> O22</td>
我想要檢索的信息,其中「305157」,「MyUserName輸入」和「O22」的第一個字母(可無論是T,K還是O)。
我使用這個正則表達式; <a href="/userinfo/userinfo\.aspx\?ID=\d*" target="helgonmain">\w*</a> \w\d\d
並且它工作正常,只要沒有任何「\ w」的åäöÅÄÖ's。
我該怎麼辦?
我真的很抱歉,但我真的需要在這裏發佈此鏈接:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except- xhtml-self-contained-tags/1732454#1732454 – 2009-11-23 21:40:00
我想發佈它,但想到我會盡力幫助他,而不是向他展示它是多麼徒勞的嘗試;)... – Wookai 2009-11-23 21:42:51
是的,發佈一個實際有用的答案會一直好。雖然沒有做過多的HTML解析代碼(但也許會建議尋找Html Agility Pack,它似乎不時彈出一個很好的HTML解析庫:http://www.codeplex.com/htmlagilitypack) – 2009-11-23 23:35:39