請任何人都可以指出我如何設計/構建一個Web服務客戶端,它將消耗TB級數據並對檢索到的數據執行一些計算?如何使用Java RESTful客戶端消耗TB級數據
我在我的新工作中繼承了一個項目。該項目已經設計完成,並且在我加入團隊之前幾周已經開始。 該項目是關於從多個Web服務中檢索數據(其餘爲soap &),並在數據存儲到數據庫之前對數據執行一些計算,向用戶顯示並生成報告。
獲取數據的過程涉及從Web服務A,B,C提取一些數據,並使用該響應向Web服務X,Y & Z發出另一請求(我們無法控制Web服務生產者)。 當試圖對檢索到的數據進行一些計算時,當前的實現非常緩慢,大部分時間內存耗盡。數據量在TB或更多。 當前的實現使用maven/spring。
我正在爲這個項目制定一個新的設計(引入一些緩存等),但我需要以前遇到這種問題的任何人的一些建議。
除了顯而易見的是,有沒有什麼特別的技巧或方法呢? 我知道這對某些人來說可能聽起來像一個愚蠢的問題,但任何指針都會有所幫助。
這些數據源中的任何一個都可能丟棄一些曾經處理過的數據?如果例如其中一條流涉及你將要處理的東西,然後不再處理,然後你將它扔掉,那麼這會對速度和記憶都有好處。 – 2011-12-16 11:05:34