2009-08-10 19 views
1

我需要一種快速的方法來將一堆html屬性放在字典中。像這樣使用正則表達式檢索Html屬性

<body topmargin=10 leftmargin=0 class="something"> should amount to 

attr["topmargin"]="10" 
attr["leftmargin"]="0" 
attr["class"]="something" 

這是要完成服務器端和標記內容已經可用。我只需要刪除沒有價值的標籤,並考慮到不同的引號或缺乏。

我猜應該使用正則表達式。發現了一些類似的問題,但沒有一個真正符合我的需求。

感謝

編輯:澄清服務器端

回答

0

我也認爲,使用專門的解析器會更好,但如果你想使用正則表達式,你可以試試:

\<(?<tag>[a-zA-Z]+)((?<name>\w+)="?(?<value>\w+)"?)*\> 

我只是測試它,工作得很好

4

HtmlAgilityPack什麼?

+0

什麼呢?我不需要一個新的框架或html解析器來完成這個任務,我知道一個很好的正則表達式可以解決這個問題。只有這些年我仍然吸取正則表達式。 – danijels 2009-08-10 12:39:17

+0

這是爲什麼downvoted?它似乎相關並且有用。 – djna 2009-08-10 12:40:26

+2

@danijels - 使用正則表達式來解析HMTL是非常困難的。我強烈建議你考慮這個答案。 (順便說一句) – 2009-08-10 12:40:45