服務器正在通過外部源(網絡服務等)接收某些過程的監控數據的某個速率(每分鐘12個)。現在流程可能會運行一分鐘(或小於)或一小時或一天。在這個過程結束時,我可能會有5或720或17280個數據點。這些數據正在收集超過40個參數,並存儲到數據庫中,以供將來通過網頁顯示。想象一下,有超過1000個進程正在運行,並且產生了大量的數據。我必須堅持RDBMS(特別是MySQL)。因此,我希望在將數據存儲到數據庫之前,通過選擇僅統計上有意義的點來處理數據並減少數據量。最終目標是將這些數據點繪製在Y軸將是時間的圖上,X軸將由某個參數(數據點的一部分)表示。如何從一組點中選擇統計顯着點?
我不想錯過任何顯着的波動或性質,但同時我無法設法繪製所有數據點(萬一數字大於100)。
請注意,我知道基本的統計術語如平均值,標準偏差等
嘗試[搜索「異常值檢測方法」](https://www.google.co.uk/#newwindow=1&q=outlier+detection+methods)以獲取一些想法。 –
@RogerRowland ..我在上面..謝謝 – abhijeet