2012-03-02 25 views
0

我一直在閱讀有關beautifulSoup,http頭,身份驗證,cookie和一些關於機械化的內容。如何找到在網站上使用的身份驗證

我想用python刮我最喜歡的藝術網站。就像我找到了一個刮板的偏差藝術。現在我試圖登錄,但我嘗試的基本身份驗證代碼示例不起作用。

所以問題,我如何找出什麼類型的驗證網站使用,以便我知道我正在嘗試登錄正確的方式?在嘗試阻止漫遊器時包含有效的用戶代理等內容。

忍受我的無知,因爲我是陌生的HTTP,Python和刮。

回答

0

您感興趣的任何網站都不太可能使用基本身份驗證。您需要一個類似機械化的庫來管理cookie,並且您需要將登錄信息提交到網站的登錄頁面。

+0

謝謝我開始相信我不會得到任何幫助。我已經閱讀了一些關於機械化的內容,但是這些描述讓我感到困惑,所以我甚至都沒有打擾過它。有沒有關於如何使用機械化python版本的教程來達到我的目的? – MotionlessMirror 2012-03-03 17:02:40

+0

我推薦scraperwiki.com,他們有教程,還有其他人的python +機械刮刀供您查看。 – pguardiario 2012-03-04 00:20:46

相關問題