我剛剛建立了一個mediawiki服務器。我想從維基百科導出數據,但默認情況下它不允許pagelink_depth
高於0。您似乎只能通過設置自己的mediawiki並調整$wgExportMaxLinkDepth
來更改最大pagelink_depth
。現在我已經完成了所有這些,但很顯然,我自己的mediawiki沒有內容。所以我想知道是否有辦法將所有wikipedia批量複製到我自己的服務器上。從我讀過的信息看來,這似乎只能用100頁左右的時間完成。如果是這種情況,那麼Special:Export一般只有0個目的,因爲您需要在導出之前確切地知道要導入哪些頁面,這完全破壞了目的。任何幫助將非常感激。mediawiki特別:出口
1
A
回答
3
特別說明:導出並不意味着一個完整導出一個wiki,特別是不使用web界面和數據庫中的這麼多頁面。 Special:如果您想要導出一個包含所有內容的已知頁面以將該頁面(或少量頁面)導入到另一個wiki中,則應該使用導出。從一個wiki導出和導入模板到另一個。因此,特別:出口專用頁面有一個有效的目的,但你嘗試使用它用於其它用途情況下,它不是爲開發;)
如果你要導出任何頁面的MediaWiki wiki,您應該使用維護腳本(可通過命令行運行)dumpBackup.php或維護文件夾中的任何其他備份腳本。這將確保你得到你想要的東西。
對於維基百科的情況,您無法訪問這些腳本(我僅提到這個腳本僅用於通用目的),但維基媒體基金會提供了維基媒體維基的database dumps,包括維基百科。
-2
「所以我想知道是否有一種方法可以將所有維基百科大容量複製到我自己的服務器上」我會建議僅僅根據數據的絕對大小&大量的開放鏈接(或「紅鏈接」或「壞鏈接」),如果你實際上並沒有你會加入複製所有英寸更好的辦法是按照所有關於NAMING頁的維基百科約定,到標點符號..然後編寫一個腳本,檢查說一次,晚上你是否有聯繫的東西,在維基百科已經定義,然後進口只有PAGE並增加了一個鏈接往上頂到IT的確切版本已導入。這樣,你不僅帶給你真正的參考,但你的數據庫可以與維基百科的整合。
如果您必須支持多種語言(如西班牙語或法語),這也會非常方便,因爲維基百科已鏈接到「另一種語言的同一文章」,因此至少爲您翻譯了這些概念。
相關問題
- 1. Transclude MediaWiki中的類別
- 2. MediaWiki API:獲取類別樹
- 3. 類別成員API - Mediawiki
- 4. 鏈接到MediaWiki:自己的分機特殊頁 - 缺少別名
- 5. Mediawiki API:從特定類別的文章中獲取圖像
- 6. Mediawiki API - 限制搜索(srsearch)到特定類別
- 7. Mediawiki 1.26.2升級 - 單列中列出的類別
- 8. 網站彈出窗口爲「每月特別」
- 9. 在MediaWiki中創建一個彈出窗口
- 10. 篩選出特定類別
- 11. Mediawiki的下拉值:從類別+無
- 12. 如何在MediaWiki中識別舊頁面
- 13. MediaWiki Api-在類別文本搜索
- 14. 機器人編輯mediawiki類別
- 15. 保護MediaWiki中的類別分配
- 16. MediaWiki類別不會自動更新
- 17. Mediawiki類別不包含頁面
- 18. 80端口有什麼特別之處?
- 19. 如何識別特定的USB端口
- 20. 自動鏈接到MediaWiki進口與powershell_script
- 21. 從MediaWiki安裝中導出文本(MediaWiki標記)
- 22. 彈出窗口和彈出窗口之間有什麼區別?
- 23. Mediawiki的文章許可,塊特殊頁
- 24. MediaWiki:特殊頁面上的頁數:AllPages
- 25. 什麼投入MediaWiki用戶特定common.js
- 26. 掩蓋mediawiki中的特殊頁面
- 27. 什麼是Semantic Mediawiki的Date特性?
- 28. 如何根據特定的電子郵件地址自動識別MediaWiki用戶?
- 29. Fortran - 通用接口和特定接口的區別
- 30. 如何輸出特定類別