我試圖從xml解析維基百科頁面。 我使用特殊:導出鏈接以獲取頁面的就是那樣的鏈接XML:從維基百科頁面獲取xml
http://en.wikipedia.org/wiki/Special:Export/Bruce_Willis
但是,當我試圖讓我不能使用這個鏈接文件或目錄頁,例如,該頁面不返回XML:
的http:// en.wikipedia.org/wiki/Special:Export/Category:English-language_films
的http:// en.wikipedia.org /wiki/Special:Export/File:Bruce_Willis_by_Gage_Skidmore.jpg
我找到了一個解決方案,但我不明白:
- 將名稱空間添加到頁面名稱的前綴(例如, 'Help:Contents'), ,除非選定的命名空間是主命名空間。
- 重複上述用於其他命名空間的步驟(如產品類別: 模板:等)
將該溶液我發現在http://meta.wikimedia.org/wiki/Help:Export。 這是什麼意思請。
謝謝。
嗨,我不知道你在說什麼。 http://en.wikipedia.org/wiki/Special:Export/Category:English-language_films確實爲我生成了一個XML。你是在尋找一個類別中的__頁面_而不是? – BenMQ 2013-02-12 13:14:15
是的,那我在找什麼 – 2013-02-12 14:40:34