2011-12-14 35 views
0

我有一堆html文件(5000)。尋找特定的文本並轉換成鏈接

我的業務需求定義了一個參考格式,假設它是XXX-YY(Year)-ZZZ。

我想通過這樣的鏈接來代替,在所有的HTML文件,這樣的格式的任何發生:

<a href='~/app/document/XXX-YY(Year)-ZZZ'>XXX-YY(Year)-ZZZ</a>

雖然這聽起來很「簡單」的使用標準正則表達式替換,它實際上更困難因爲我認爲這個過程可以運行多次。

我現在的過程將「鳥巢」的替代品,以產生這樣的:

<a href='~/app/document/<a href='~/app/document/XXX-YY(Year)-ZZZ>XXX-YY(Year)-ZZZ</a>><a href='~/app/document/XXX-YY(Year)-ZZZ>XXX-YY(Year)-ZZZ</a></a>

我怎樣才能達到我的目標是什麼?

PS:性能是不是一個問題(當它停留至少合理的)

回答

0

所有你需要的是:HTML Agility Pack

檢查這一個:c# html agility pack和大量的關於在這裏的其他問題在SO; - )

這是因爲你最好使用一個理解HTML樹的解析器,而不僅僅是正則表達式或文本解析,這可能會因具體標記而失敗......