2009-10-29 53 views
-5

我想自己顯示數據,如何使用cms系統如drupal等進行爬網?

使用cms只能抓取數據。

任何人都可以分享經驗,並給我一些線索的入口點?

+1

你能否擴展你的問題 - 我無法真正瞭解你在做什麼。 CMS只是一個內容管理系統,它可以讓你編輯你的網頁並執行相關任務,它不會像蜘蛛一樣抓取互聯網。 – Fenton 2009-10-29 08:23:14

+0

但是大多數CMS用戶本身沒有爬蟲,他們如何檢索數據? – user198729 2009-10-29 08:31:20

+3

CMS不搜尋。 CMS =內容管理系統,而不是履帶式管理系統。 – Raptor 2009-10-29 08:32:13

回答

3

我將重新解釋問題:「我如何使用Drupal創建和聚合內容,但通過HTML網頁以外的方式顯示它?」

答案是關注生成XML提要。在Drupal Core中,默認的rss feed位於/rss.xml。每個分類列表頁面還有一個與其關聯的RSS源。要進一步擴展這些選項,請使用視圖中的RSS源顯示,Views Datasource模塊添加更多種類的數據(例如JSON輸出),如果您想要處於最前沿,請使用RDF項目。

如果您不想將任何此內容顯示爲HTML,請在Drupal中生成的幾乎每個頁面上使用hook_menu_alter() - 運行每個節點並將其阻止。那時候,這個問題就變成了一種學術問題,因爲如果你對主題層不感興趣,任何CMS都是錯誤的工具。

相關問題