2013-03-07 85 views
0

我在找的是如何解析目前爲止的內容。解析內容對我來說不是問題,我只是不清楚如何獲取內容!如果我有一堆坐在文件夾中的XML文件,我可以輕鬆篩選並處理它們,我只是不知道如何將它們放在文件夾中。如何獲得RSS源以使用PHP進行處理?

我也可以抓取文件的位置並以這種方式抓取它們,但是我發現的所有提要似乎都只是新聞故事的鏈接,而不是其中的任何一個,它們都不僅僅是XML。

我不想使用任何第三方CMS如Drupal或Wordpress。對不起,如果這是一個愚蠢的問題。預先感謝任何幫助!

編輯:我昨晚做了搜索,現在我只是再次搜索,並在五秒鐘內在新聞網站上發現了一個純XML XML feed,我正在尋找哪裏找不到一個昨晚。而不是提供可下載的文件,這一切RSS饋送通常將作爲?可瀏覽文件/頁面?

編輯2:是的,看起來就是這樣。對不起大家!那麼,希望那些有類似問題的人會得到幫助。編輯3:好吧,既然我現在創建線程,任何人都可以告訴我,如果SimpleXML或解析(比如Magpie)會更快,處理明智嗎?我的假設是SimpleXML是要走的路。

+0

xml與cdata部分(例如攜帶html)實際上*只是* xml。 rss實際上不是*只是* xml,而是一個xml應用程序。 – 2013-03-07 04:41:11

+0

你指的是哪種文件?堆棧溢出的[feed for this question](http://stackoverflow.com/feeds/question/15263177)是XML。 – 2013-03-07 04:44:13

+0

我想我會覺得很愚蠢,這取決於我編輯的答案。對不起,如果我在這裏浪費大家的時間。我以爲實際上會給我的文件下載到我的服務器上,而不是簡單地瀏覽到給定的位置並以這種方式抓取文本。 – 2013-03-07 04:47:08

回答

0

有很多選項可供閱讀,但我喜歡用TTP://magpierss.sourceforge.net/

0

我不能完全肯定這是你想要的,但是,將這項工作的嗎?

wget -q -O- "http://www.tuxradar.com/rss" 

我在PC上的Cygwin上做了這個,但它可以在Linux或Mac終端上工作。你也可以將輸出重定向到文件,如果你想:

wget -q -O- "http://www.tuxradar.com/rss" > tux.xml 
+0

在這裏抓取RSS不是問題,他想知道如何閱讀 – Vineet1982 2013-03-07 04:55:34