2012-02-06 65 views
2

我想要通過feed獲取新聞或網站的完整內容。但是我們知道很多網站只會通過他們的Feed提供部分新聞或帖子。
當然,我知道存在一個名爲SimplePie的腳本,該腳本是爲通過Feed獲取網站內容而開發的。但是這個腳本不能檢索新聞的全部內容。
當然,我發現了一個名爲Full-Text Feeds的腳本。但它不是免費的。我想要一個免費的腳本。
你知道一個類似的腳本或方法來做我的需要嗎?通過feed提取網站的完整內容php

回答

8

Five Filters的內容提取背後的代碼實際上是open source,它基於Readability的原始Javascript(在它們成爲服務之前)。

您應該能夠使用它像這樣:

$page = file_get_contents($item_url); 
$readability = new Readability($page); 
if ($result = $readability->init()) { 
    $content = $readability->getContent()->innerHTML; 
} 
+0

@RyanMcQue鏈接不工作,替代鏈接? – urok93 2013-02-16 15:38:07

+0

@drtanz修正了這個問題,看起來像他們重組他們的網站。 – 2013-02-18 08:16:49

+0

@RyanMcCue,它像一個魅力:) – lokeshpahal 2015-01-28 05:16:05

-2

你可以使用http://magpierss.sourceforge.net/cookbook.shtml(免費)

它檢索RSS提要。有許多許多PHP腳本可以在網絡上執行此操作... Google si您的朋友! :)

+2

艾哈邁德這裏尋找免費的腳本,需要的飼料,然後獲取新聞條目的全部內容,而不是僅僅摘錄的Feed – Navarr 2012-02-06 16:19:52

+0

是的,它是正確的Navarr – 2012-02-06 16:24:28

0

不能完全確定你想在這裏做什麼,但是這可能會幫助您:

$full_page_content = file_get_contents('http://www.example.com/'); 

編輯:好吧,如果我理解正確的話,您需要做這樣的事情:

Get rss feed 
Use SimplePie or something like it to go through each feed item 
For each item in RSS feed 
    Get the item's url 
    Get the content from that URL 
    Strip out the HTML/extract only the text you need 
Combine all of these into a new RSS feed and send that to the user 

注意:這不是一件簡單的事情。全文RSS可以爲他們的產品收費是有原因的。

+0

OP基本上想要一個免費版本的上述鏈接的全文Feed。 – Navarr 2012-02-06 16:21:22