我正在使用NLTK來發送Web請求中的Tweets標籤。如您所知,Django爲每個請求實例化一個請求處理程序。POS標籤性能低下。我可以做某種預熱嗎?
我注意到了這一點:對於一個請求(約200條推文),第一條推文需要~18秒才能標記,而後面的所有推文需要約120毫秒才能標記。我能做些什麼來加速這個過程?
我可以做一個「預熱請求」,以便模塊數據已經爲每個請求加載嗎?
class MyRequestHandler(BaseHandler):
def read(self, request): #this runs for a GET request
#...in a loop:
tokens = nltk.word_tokenize(tweet)
tagged = nltk.pos_tag(tokens)
這似乎不是Django代碼:除了在一些深層內部,Django不使用'Handler'。可能是AppEngine的webapp嗎? – 2012-07-23 09:50:16
在啓動時用假申請填滿它?聽起來就像它的工作原理一樣,除非你長時間的第一次請求超時。 – tripleee 2012-07-23 09:57:44
@tripleee每個**請求的第一條推文發生18秒延遲 – aitchnyu 2012-07-23 10:01:16