2010-12-09 17 views
1

我構建了一個應用程序,讓您選擇您喜歡的主題,這些主題應該在DB中。來自維基百科的頁面列表

有數百萬'喜歡'! (披薩,PHP,曼徹斯特團結,任何電影..我不知道),所以我決定插入這些'喜歡'與維基百科我的數據庫。

那麼,有一種方法可以讓所有這些'喜歡'(與api我有一個限制(我認爲每次搜索500)?或其他解決方案?

非常感謝。

+1

我只想從維基百科獲得頁面列表。在我的網站上,用戶可以選擇他喜歡的語言。 (從列表中) – Luis 2010-12-09 09:38:14

+0

我很確定會有數十位粉絲:http://en.wikipedia.org/wiki/23155_Judithblack或http://en.wikipedia.org/wiki/California_Secretary_of_State_election,_2006 – Mchl 2010-12-09 09:43:53

+0

爲什麼不這樣做通常的方式,即讓用戶手動輸入新的喜歡,如果他們無法找到現有的列表上的東西? – Mchl 2010-12-09 09:44:50

回答

1

查看WikiMedia技術文檔。有一節討論query continuation

或者,您可以下載維基百科轉儲,安裝您自己的WikiMedia副本並查詢您的內容。轉儲數量巨大,但取決於您想要提取多少內容,這可以更快地完成任務,並且對維基百科服務的影響較小。

1

這是有點不清楚你實際上試圖從維基百科檢索到什麼信息。網頁標題?

維基媒體提供的XML文件包含download.wikimedia.org所有項目的所有頁面標題。 (遺憾的是由於硬件問題,轉儲似乎不可用)。您可以解析XML文件並將所有標題存儲在您自己的數據庫中。

0

轉儲可以從維基百科以各種格式獲得,具有不同的詳細程度。

選擇一個最適合您的需求並解析它。