我想通過以下http://www.mediawiki.org/wiki/Manual:Parameters_to_Special:Export從土耳其維基百科頁面導出一個類別。這是我正在使用的代碼;用Python導出維基百科
# -*- coding: utf-8 -*-
import requests
from BeautifulSoup import BeautifulStoneSoup
from sys import version
link = "http://tr.wikipedia.org/w/index.php?title=%C3%96zel:D%C4%B1%C5%9FaAktar&action=submit"
def get(pages=[], category = False, curonly=True):
params = {}
if pages:
params["pages"] = "\n".join(pages)
if category:
params["addcat"] = 1
params["category"] = category
if curonly:
params["curonly"] = 1
headers = {"User-Agent":"Wiki Downloader -- Python %s, contact: Yaşar Arabacı: [email protected]" % version}
r = requests.post(link, headers=headers, data=params)
return r.text
print get(category="Matematik")
由於我試圖從土耳其維基百科獲取數據,我使用了它的url。其他事情應該是自我解釋。我正在獲取可用於導出數據而不是實際xml的表單頁面。任何人都可以看到我在這裏做錯了什麼?我也嘗試了一個請求。
什麼問題?你有什麼錯誤嗎? – svick
@svick我得到的頁面,您可以提交表單獲取數據,而不是獲取實際的數據。 – yasar