2012-02-11 71 views
0

在最新版本的Safari中,有一個「閱讀器」按鈕出現在某些網頁的地址欄中。當您點擊此按鈕時,它會爲您提供該文章的純文字版本,不含任何不屬於該文章範圍的廣告或內容。我想創建一個網絡應用程序,當用戶輸入網上文章的URL(例如紐約時報文章)時,它會做類似的事情。輕鬆從在線出版物中提取文章文本

我想知道如果任何人有任何猜測是否在Safari此功能在實現:

  • 一種複雜的方式,例如通過文章「掠過」並遵循一些算法來猜測要提取哪些標籤等。
  • 一種簡單的方法,例如,訪問某種僅提供文章文本的RSS或Atom提要。從我所知道的情況來看,大多數這些提要似乎只提供文章和鏈接的簡短描述,而不是全文。

有什麼想法?

回答