Q

從HTML頁面中提取可本地化的內容

2011-08-17 87 views 0 likes

0

我需要一些建議，以瞭解我需要在正在處理的項目中實現的功能的最佳方法。從HTML頁面中提取可本地化的內容

基本上，我需要能夠從HTML頁面中提取所有可本地化的內容（即所有字符串）。我真的不想去寫HTML解析器。該應用程序是用C＃編寫的。

有沒有人有這方面的經驗，或任何人都可以推薦一個現有的圖書館，我可以用它來完成？

謝謝。

2011-08-17 Jimmy Collins

A

回答

1

您不必編寫自己的解析器。幸運的是，其他人已經這樣做了。
要解析HTML文件，您可以使用HTML Agility Pack。

在這種情況下，您將收到文檔對象模型，您可以像任何其他DOM一樣走路。請找到這些例子：

http://www.4guysfromrolla.com/articles/011211-1.aspx
http://htmlagilitypack.codeplex.com/wikipage?title=Examples&referringTitle=Home

而且這個問題：

How to use HTML Agility pack

2011-08-17 10:29:54

+0

謝謝，我會看看這個。順便說一句，您的鏈接上面的HTML敏捷包看起來內部的賽門鐵克;-) –

+0

@Jimmy C：Yeap，不知何故，我犯了一個錯誤。幸運的是，這不是什麼敏感的東西:) –

相關問題