2012-03-14 33 views
2

我正在尋找一些獲取不同頁面(博客文章,雜誌等)的乾淨HTML內容的工具。基本思想是iOS Safary中的'Reader'是如何工作的。獲取網頁內容,與可讀性類似於服務

This answer我可以告訴iOS,Safary使用Readability進行內容解析。不幸的是,API不包含任何解析方法,而是保存書籤並獲取它的內容,這不適合我。

另一個回答here建議使用https://www.readability.com/api/content/v1/parser但它不適用於我。

對類似服務有何建議?

回答

0

看一看Tranquility。它是一個Firefox插件,所以你可以看看源代碼。您可以下載XPI並解壓縮它。然後查看content/tranquility.js和content /中的相關文件。