我有一個服務在本地服務器上運行,使用Python threading庫編寫。把它想象成一種網絡爬蟲。它使用50個線程。我想將它部署在Amazon Web Services雲上並將其擴展,因此它使用更多的線程。AWS和Python線程可伸縮性
簡單地說,我有兩個queues:Qinput
與網址和Qoutput
與網頁內容。線程從Qinput
中挑選URL,將網頁的內容提取到Qoutput
問題:僅僅將線程數增加到500,5000或50,000就足夠了,AWS + Python將處理它?我應該期望服務能夠無縫運行,還是有一些「標準」設計陷阱,我應該知道在AWS上移植多線程服務時應該注意些什麼?
我知道Global Interpreter Lock雖然它不應該在這裏的一個問題,因爲線程的主要任務是在檢索/刮頁
你可以看到http://stackoverflow.com/questions/12996254/what-are-the-advantages-of-multithreaded-programming-in-python我該如何理解線程的增加並沒有直接關係的表現。 – Denis