這些都是在蟒蛇履帶的定義:如何代理添加到BeautifulSoup履帶
from __future__ import with_statement
from eventlet.green import urllib2
import eventlet
import re
import urlparse
from bs4 import BeautifulSoup, SoupStrainer
import sqlite3
import datetime
如何我添加了一個旋轉的代理(每線程開一個代理),以遞歸cralwer上BeautifulSoup工作?
我知道,如果我是用機械化的瀏覽器中添加的代理:
br = Browser()
br.set_proxies({'http':'http://username:[email protected]:port',
'https':'https://username:[email protected]:port'})
,但我想知道具體是什麼樣的解決方案將BeautifulSoup需要。
非常感謝您的幫助!