我只有一個帖子的網址,如http://www.avc.com/a_vc/2011/08/html5-continued.html,是否有任何獲得這篇文章內容的方式?我的意思是,排除菜單,標誌和廣告。如何從博客中獲取一篇文章的內容?
非常感謝!
我只有一個帖子的網址,如http://www.avc.com/a_vc/2011/08/html5-continued.html,是否有任何獲得這篇文章內容的方式?我的意思是,排除菜單,標誌和廣告。如何從博客中獲取一篇文章的內容?
非常感謝!
如果你想刮這個網站,首先要考慮這是否合法。
然後,你可以這樣做得到適當的元素的innerHTML
(或與jQuery - .html()
)。在你的情況下,這是disqus_post_message
正如@ bensiu指出,它會更容易使用RSS提要。
既然你標記的Java,這裏有可能是有用的庫:
謝謝bozho!但我已經知道這兩個框架,事情就是這樣我應該爲每個網站實施一個模式。關於rss的東西,嘗試找到de rss鏈接,然後找到具有相同url的標籤。最後一種情況看起來更好,但有數百種變化,所以如果可能的話,我想避免這種選擇。 – deniswsrosa
使用RSS提要什麼是可用 – bensiu
此頁面上java是爲了javascript,因爲汽車是汽車:-P – Neal