我想編寫一個Rails應用程序,它可以像Evernote Clipper一樣捕獲網頁。如果您不熟悉,可以在瀏覽器中單擊工具欄上的按鈕,捕獲網頁佈局的相當準確的副本。例如,轉到http://www.evernote.com/pub/jssmith072/shared並單擊該頁面上的單個註釋,您將能夠看到我捕獲的網頁。有幾個原因我不知道從哪裏開始:在Rails應用程序中重現Evernote Web Clipper
-
如何以編程方式在Rails應用程序中獲取呈現的網頁?可以/我應該使用WebKit嗎? - 如何將此網頁存儲在我的數據庫中?
- 如何在瀏覽器中一致顯示此網頁存檔?
我在http://code.google.com/p/arc90labs-readability/上發現了一個名爲Readability的JavaScript庫,我可以將它移植到Ruby中,並通過編程方式從網頁獲取我需要的內容。它基本上剝離了所有內容,但是從頁面中獲得了不錯的內容我想我可以使用Nokogiri來解析HTML。我仍然不確定如何獲取Readability找到的圖像或如何存儲/查看它。 – Jake 2010-07-10 02:43:36
好吧,顯然我可以使用open-uri讀取圖像的二進制數據,但我仍然不確定如何構建/存儲/查看數據。 – Jake 2010-07-10 03:01:56