我想要通過feed獲取新聞或網站的完整內容。但是我們知道很多網站只會通過他們的Feed提供部分新聞或帖子。
當然,我知道存在一個名爲SimplePie
的腳本,該腳本是爲通過Feed獲取網站內容而開發的。但是這個腳本不能檢索新聞的全部內容。
當然,我發現了一個名爲Full-Text Feeds
的腳本。但它不是免費的。我想要一個免費的腳本。
你知道一個類似的腳本或方法來做我的需要嗎?通過feed提取網站的完整內容php
回答
Five Filters的內容提取背後的代碼實際上是open source,它基於Readability的原始Javascript(在它們成爲服務之前)。
您應該能夠使用它像這樣:
$page = file_get_contents($item_url);
$readability = new Readability($page);
if ($result = $readability->init()) {
$content = $readability->getContent()->innerHTML;
}
你可以使用http://magpierss.sourceforge.net/cookbook.shtml(免費)
它檢索RSS提要。有許多許多PHP腳本可以在網絡上執行此操作... Google si您的朋友! :)
艾哈邁德這裏尋找免費的腳本,需要的飼料,然後獲取新聞條目的全部內容,而不是僅僅摘錄的Feed – Navarr 2012-02-06 16:19:52
是的,它是正確的Navarr – 2012-02-06 16:24:28
不能完全確定你想在這裏做什麼,但是這可能會幫助您:
$full_page_content = file_get_contents('http://www.example.com/');
編輯:好吧,如果我理解正確的話,您需要做這樣的事情:
Get rss feed
Use SimplePie or something like it to go through each feed item
For each item in RSS feed
Get the item's url
Get the content from that URL
Strip out the HTML/extract only the text you need
Combine all of these into a new RSS feed and send that to the user
注意:這不是一件簡單的事情。全文RSS可以爲他們的產品收費是有原因的。
OP基本上想要一個免費版本的上述鏈接的全文Feed。 – Navarr 2012-02-06 16:21:22
- 1. 通過PHP獲取網站內容
- 2. 如何通過python獲取網頁的完整內容
- 3. 通過認證從外部網站提取內容。
- 4. QT4未完成獲取網站內容
- 5. 抓取整個網站內容
- 6. 從另一個網站提取內容
- 7. 通過網站更新Android內容?
- 8. 從Atom Feed中提取內容
- 9. 從可能使用Cookie的網站的URL中提取HTML內容通過Python
- 10. 完整的多語言網站在php
- 11. PHP包括完整的URL(或網站)
- 12. 完整Silverlight網站內容的搜索能力
- 13. 通過PHP獲取DOM的內容
- 14. 如何通過動態內容加載來抓取網站?
- 15. 通過使用css路徑從網站獲取內容
- 16. 通過javascript從網站獲取動態內容
- 17. 如何通過閱讀Div內容來獲取網站數據
- 18. 如何通過一些參數獲取網站內容?
- 19. 具有完整網址的子內容?
- 20. 將外部網頁內容添加到網站Feed
- 21. 網站內容抓取
- 22. 通過jQuery提取和使用內容
- 23. 如何從Yahoo!中的rss feed獲取完整內容描述管?
- 24. 通過網址在網站內容中查找網址嗎?
- 25. WordPress的內容通過PHP
- 26. 通過php curl抓取內容
- 27. 通過PHP獲取文件內容cURL
- 28. PHP在網址中獲取帶有錨點的網站內容
- 29. cURL PHP網站通過CookieJar
- 30. 獲取XML項目的完整內容?
@RyanMcQue鏈接不工作,替代鏈接? – urok93 2013-02-16 15:38:07
@drtanz修正了這個問題,看起來像他們重組他們的網站。 – 2013-02-18 08:16:49
@RyanMcCue,它像一個魅力:) – lokeshpahal 2015-01-28 05:16:05