2016-02-05 66 views
1

我剛剛建立了一個mediawiki服務器。我想從維基百科導出數據,但默認情況下它不允許pagelink_depth高於0。您似乎只能通過設置自己的mediawiki並調整$wgExportMaxLinkDepth來更改最大pagelink_depth。現在我已經完成了所有這些,但很顯然,我自己的mediawiki沒有內容。所以我想知道是否有辦法將所有wikipedia批量複製到我自己的服務器上。從我讀過的信息看來,這似乎只能用100頁左右的時間完成。如果是這種情況,那麼Special:Export一般只有0個目的,因爲您需要在導出之前確切地知道要導入哪些頁面,這完全破壞了目的。任何幫助將非常感激。mediawiki特別:出口

回答

3

特別說明:導出並不意味着一個完整導出一個wiki,特別是不使用web界面和數據庫中的這麼多頁面。 Special:如果您想要導出一個包含所有內容的已知頁面以將該頁面(或少量頁面)導入到另一個wiki中,則應該使用導出。從一個wiki導出和導入模板到另一個。因此,特別:出口專用頁面有一個有效的目的,但你嘗試使用它用於其它用途情況下,它不是爲開發;)

如果你要導出任何頁面的MediaWiki wiki,您應該使用維護腳本(可通過命令行運行)dumpBackup.php或維護文件夾中的任何其他備份腳本。這將確保你得到你想要的東西。

對於維基百科的情況,您無法訪問這些腳本(我僅提到這個腳本僅用於通用目的),但維基媒體基金會提供了維基媒體維基的database dumps,包括維基百科。

-2

「所以我想知道是否有一種方法可以將所有維基百科大容量複製到我自己的服務器上」我會建議僅僅根據數據的絕對大小&大量的開放鏈接(或「紅鏈接」或「壞鏈接」),如果你實際上並沒有你會加入複製所有英寸更好的辦法是按照所有關於NAMING頁的維基百科約定,到標點符號..然後編寫一個腳本,檢查說一次,晚上你是否有聯繫的東西,在維基百科已經定義,然後進口只有PAGE並增加了一個鏈接往上頂到IT的確切版本已導入。這樣,你不僅帶給你真正的參考,但你的數據庫可以與維基百科的整合。

如果您必須支持多種語言(如西班牙語或法語),這也會非常方便,因爲維基百科已鏈接到「另一種語言的同一文章」,因此至少爲您翻譯了這些概念。