的處理順序我寫一個網絡爬蟲是在同一時間處理多個網址,並在工作方式如下:Python的線程模塊
它得到一個URL從URL列表包含在seed_list。 txt,
它抓取它並將數據寫入data.txt;
就像大多數網絡爬蟲工作。
當我使它成爲單線程時,我可以按照與seed_list.txt中的URL相同的順序獲取data.txt中的數據,但是當它是多線程時,我似乎無法控制它隨着每個線程完成後將數據寫入data.txt。
有沒有辦法讓我的網絡爬蟲多線程,但保持原來的秩序?
非常感謝!
@Lance,伊格納西奧和馬克西姆,
謝謝大家的幫助 - 你的答案絕對點我在正確的方向。
非常感謝您指點我正確的方向。 – BananaOnTheWall 2012-04-03 04:20:01