我已經下載了維基百科最新的轉儲並解析它一個MySQL數據庫。現在我有數據庫表,只包含標題和內容。我的要求是從這張表中提取所有傳記內容。所以我想要一個轉儲文件,所有的傳記標題。 在此先感謝在維基百科訪問傳記的標題
0
A
回答
0
如果您想獲取某個類別及其所有子類別中的所有文章,則需要使用the categorylinks
table並遞歸執行以獲取子類別中的文章。
從你的問題中不清楚你到底想要什麼。如果你想約傳記,請看Category:Biography。如果您想要爲傳記的文章,請查看Category:People的子類別。
+0
我需要關於人物的文章。我可以獲得維基百科有關人物的所有文章主題。像一個mysql轉儲 – 2012-04-03 11:29:14
+0
不,你需要自己走過類別樹。 – svick 2012-04-03 11:31:56
相關問題
- 1. 從維基百科獲取維基百科主題標題
- 2. 訪問維基百科webservices
- 3. JWPL例外,在訪問維基百科
- 4. 使用JSONP訪問維基百科API
- 5. 維基百科:Java庫刪除維基百科文本標記刪除
- 6. 從標題獲取維基百科pageid
- 7. 解析維基百科頁表問題
- 8. 維基百科API搜索問題
- 9. Ajax請求維基百科API問題
- 10. 維基百科API
- 11. 忘記替代維基百科
- 12. API爲維基百科的
- 13. 維基百科的JAVA API
- 14. 如何在維基百科標記中構建完整的URL [[File:...]]標記?
- 15. 如何訪問嵌套對象在維基百科API
- 16. 從目錄中的文件解析出維基百科標記
- 17. 可以標記維基百科頁面的Python庫
- 18. wikitools,維基百科和python
- 19. 腳本從維基百科
- 20. 尋找從維基百科
- 21. 維基百科與Python
- 22. 解析XML維基百科
- 23. 解析維基百科類
- 24. 維基百科人物API
- 25. 維基百科第一段
- 26. 提取維基百科
- 27. 維基百科web框架?
- 28. 維基百科解析器
- 29. lucene維基百科查詢
- 30. 迭代維基百科
有一個數據庫表只包含與該標題相關的標題和內容。這是我通過解析enwiki-articles-latest.xml得到的。但我的要求是隻獲取與傳記類別名稱有關的內容。如果我有維基百科中的所有傳記列表,我可以從我的數據庫表中獲取內容。 – 2012-04-03 05:27:02