我一直在玩PHP和http://www.alchemyapi.com/,並embed.ly 但我想知道如果有其他選項外面有導入和解析的網頁,任何頁面,要麼是新聞網站或博客...從其他網站導入/刮取頁面內容?
感謝
我一直在玩PHP和http://www.alchemyapi.com/,並embed.ly 但我想知道如果有其他選項外面有導入和解析的網頁,任何頁面,要麼是新聞網站或博客...從其他網站導入/刮取頁面內容?
感謝
獲取數據:curl
,file_get_contents
(可能是其他那些是兩種常見的)
爲了解析數據:PHP: DOM
,SimpleXML
preg_match
**
由於它是用PHP標記的,我只給了PHP的工作信息。有很多方法可以做到這一點,如果你可以縮小你的問題的範圍,你會嘗試做什麼,這將有所幫助。解析任何網站的更好的方法是通過他們的RSS提要,如果他們有一個,或通過他們的API,推測他們通過RSS/API提供你想要的內容。
** preg_match
是不是一個偉大的選擇它的「工作」,但更好的,如果可以使用DOM /簡單的XML功能。
我只是想從外部網站上保存帖子或個人使用的新聞,所以他們可能沒有api,或者他們的RSS不完整 – Francesco 2011-05-10 01:12:57
我使用cURL
和preg_match
寫在工作中爬行之前,我選擇了這樣做的,我看着DOM解析器http://php.net/manual/en/book.dom.php
告訴我們到底在找什麼,當你說「等選項「,否則這是一個非常開放的問題。 – 2011-05-09 22:05:29