0
我已經使刮板從網站(例如電影)中提取數據,但是如何連接到網站服務器以直接從該數據庫提取數據,而不是讓抓取工具從數據庫中提取數據視覺網站?如果你可以給我圖書館的名字,一套工具或一本你很酷的指南。從網絡服務器提取數據
extra: 請求庫是否執行此操作來獲取帖子功能?
我已經使刮板從網站(例如電影)中提取數據,但是如何連接到網站服務器以直接從該數據庫提取數據,而不是讓抓取工具從數據庫中提取數據視覺網站?如果你可以給我圖書館的名字,一套工具或一本你很酷的指南。從網絡服務器提取數據
extra: 請求庫是否執行此操作來獲取帖子功能?
您將無法直接從網站數據庫獲取數據。 有一個很好的Python包,而無需使用GUI來從網站的數據:requests
>>> r = requests.get('https://api.github.com/user', auth=('user', 'pass'))
>>> r.status_code
200
>>> r.headers['content-type']
'application/json; charset=utf8'
>>> r.encoding
'utf-8'
>>> r.text
u'{"type":"User"...'
>>> r.json()
{u'private_gists': 419, u'total_private_repos': 77, ...}
大多數主要網站都有API或替代解決方案的存在。例如:http://www.omdbapi.com/用於電影。 – Tchoupi
您通常不能進行任意的數據庫查詢 - 這將是一個巨大的安全漏洞。主要網站傾向於使用API,在某些情況下,可以使用SNORQL之類的東西。 – sapi