2014-07-21 56 views
5

當我嘗試使用Evernote clipper extension, 時,我看到一個非常有用的功能。 當我點擊「文章」時,它給了我一個非常正確的頁面主要內容。 我們看到的結果是,當我使用Evernote的快船與https://developer.chrome.com/extensions/api_indexextract article in a page如何檢測像Evernote Clipper這樣的主要文章標記

我看着主文章認爲Evernote的場出來,在幾頁,文章第一篇文章標籤提取逸岸。不過,evernote剪輯器仍然可以很好地處理頁面,而不會使用這種標籤。

我不知道Evernote削波器可以做到這一點嗎?是否有任何js庫支持來檢測包含頁面主要內容的主標籤。 你能給我一些建議嗎?

預先感謝您!

回答

6

從我的知識來看,沒有通用的js庫來做到這一點。 Evernote剪裁器使用自己的方法從網頁中提取「有趣」的內容。 您可以訪問印象筆記剪貼板的代碼,試圖瞭解該過程。

我的Mac上,路徑Chrome擴展程序是:

〜/庫/ Application Support /谷歌/鉻/默認/擴展/ pioclpoplcdbaefihamjohnefbikjilc/6.2_0/

這裏的另一個工具,它工作得大同小異: https://www.readability.com/

您還可以檢查此線程:What algorithm does Readability use for extracting text from URLs?

或谷歌搜索諸如「內容提取中的術語例如,「n js lib」。 (發現這是:https://github.com/hatena/extract-content-javascript

希望這有助於

+0

謝謝您的suggession。我正在研究項目「可讀性」 – yelliver

相關問題