2013-03-30 163 views
0

我已經使刮板從網站(例如電影)中提取數據,但是如何連接到網站服務器以直接從該數據庫提取數據,而不是讓抓取工具從數據庫中提取數據視覺網站?如果你可以給我圖書館的名字,一套工具或一本你很酷的指南。從網絡服務器提取數據

extra: 請求庫是否執行此操作來獲取帖子功能?

+1

大多數主要網站都有API或替代解決方案的存在。例如:http://www.omdbapi.com/用於電影。 – Tchoupi

+3

您通常不能進行任意的數據庫查詢 - 這將是一個巨大的安全漏洞。主要網站傾向於使用API​​,在某些情況下,可以使用SNORQL之類的東西。 – sapi

回答

0

您將無法直接從網站數據庫獲取數據。 有一個很好的Python包,而無需使用GUI來從網站的數據:requests

>>> r = requests.get('https://api.github.com/user', auth=('user', 'pass')) 
>>> r.status_code 
200 
>>> r.headers['content-type'] 
'application/json; charset=utf8' 
>>> r.encoding 
'utf-8' 
>>> r.text 
u'{"type":"User"...' 
>>> r.json() 
{u'private_gists': 419, u'total_private_repos': 77, ...} 
相關問題