我正在以極快的速度從Twitter API Streaming Server的長時間連接中獲得推文。我繼續做一些沉重的文本處理並將推文保存在我的數據庫中。使用扭曲或使用線程處理大容量流數據,使用Python中的隊列
我正在使用PyCurl的連接和回調函數,關心文本處理和保存在數據庫中。看看下面我的方法誰不能正常工作。
我不熟悉網絡編程,所以想知道: 如何使用線程,隊列或扭曲框架來解決這個問題?
def process_tweet():
# do some heaving text processing
def open_stream_connection():
connect = pycurl.Curl()
connect.setopt(pycurl.URL, STREAMURL)
connect.setopt(pycurl.WRITEFUNCTION, process_tweet)
connect.setopt(pycurl.USERPWD, "%s:%s" % (TWITTER_USER, TWITTER_PASS))
connect.perform()
定義每秒消息中「非常快」,並詳細說明「重處理」。 – MattH 2010-07-05 15:24:48
也定義「不能正常工作」 – nosklo 2010-07-05 16:45:10
Upvoted爲用戶名。對不起,忍不住:P – 2010-07-05 18:56:14