2012-10-17 135 views
0

這裏有很多產品提供了一個gui來挑選你想要從網頁上刮取的標籤。 (比如WebHarvy的例子)智能網絡抓取c#

我已經看過HTML敏捷包之前獲取DOM。 我只是想檢查是否有人知道任何漂亮的庫或進程在HTML頁面中自動查找有用內容並創建所需的XPath。

類似於Evernote和iOS如何知道「文章」在頁面上的位置。但理想情況下,重複區域和分頁工作。

回答

0

不知道這是你在找什麼:
http://www.diffbot.com/

但Diffbot是從網站抄襲內容不錯。

+0

我在圖書館或可以建成我自己的解決方案。不是真的想依靠第三方。 –

+0

我使用了Agility Pack,過去沒有發現更強大的功能。但如果你找到更好的東西,會很感興趣。 – Remy