2011-04-06 13 views

回答

2

這是一個非常廣泛的問題。 不知道代碼的任何事情,預期的網絡流量的語言選定的託管服務,我只能猜測你可能需要什麼。

一般來說說你會有一臺機器接受大量的日誌並處理它們來生成一些對你的使用有意義的排序指標。

因此,網絡設置可能需要注意(以太網連接的速度)以避免淹沒單個服務器。

RAM取決於分析的複雜性,日誌存儲基礎結構,日誌結構,每個分析迭代的大小(多少數據)以及生成的產品。
例如:假設您在平面文件中保存了1000萬條日誌行,並且您希望進行分析,該分析需要能夠鏈接來自不同行的信息,而無需對數據進行任何排序。在這種情況下,您需要以某種方式將所有1000萬行(最差情況)存儲在內存中。所以RAM可能會成爲一個問題......

空間取決於收集的日誌的數量和時間的長短,你必須留住他們,這裏沒有什麼特別。當你不需要它時獲得空間(空間通常很便宜)。

處理能力取決於分析和實施的複雜程度。例如:如果您的編程語言或代碼或第三方庫不支持多處理器執行,則更多處理能力不會顯着提高吞吐量。假設你可以利用這種力量,那麼如果你對日誌的分析非常複雜,那麼你只需要關心自己,比如說爲一個有很多點要渲染的(數學上)複雜度量生成一個圖。或者,如果您需要同時處理來自系統客戶端的許多請求,並且請求不會輕易緩存(通常不適用於這些系統)

這是我得到的最佳答案。 。
您可以使用像amazon price calculator這樣的工具來查看成本應該是多少,例如,一個amazon m1.large實例每個月大約需要250美元(只是實例),並且應該處理小型流量分析服務器。