1
我與它看起來像一個大的時間序列數據的工作:圖形異常有R
ProcesID ProcessName StartDate EndDate Duration
10 httpd 1/1/2012 1/2/1012 12 Hours
11 ftp 1/1/2012 1/2/1012 10 Hours
12 snmp 1/1/2012 1/2/1012 5 Hours
13 email 1/1/2012 1/2/1012 2 Hours
14 java 1/1/2012 1/2/1012 5 Hours
15 perl 1/1/2012 1/2/1012 7 Hours
20 php 1/1/2012 1/2/1012 6 Hours
的獨特(x$ProcessName
)數大於500,我不能圖中每個ProcessName
。我想選擇anamolies並繪製它們。
我也嘗試樣本:
y<-x[sample(nrow(x), 50, prob = NULL),]
ggplot(subset(x, ProcessName %in% y$ProcessName),
aes(StartDate, Duration, group=ProcessName)) + geom_point()
我不知道,如果是sample
進行這種分析是正確的選擇?有沒有人做過類似的工作來創建僅用於異形的人口圖?
你能定義你的意思嗎?我們在談論異常值嗎?如果是這樣,是否會讓它成爲一個非常規的時間? –
如果過程的持續時間激增,則會出現異常情況。我想繪製這些過程數據點。例如, – user1471980
@BrandonBertelsen在1/1/20012處理httpd的持續時間爲12小時。這個過程每天都在運行。比方說,如果這個過程的持續時間是2012年1月30日的20個小時,這是一個異常現象,我想繪製這個過程持續時間等。 – user1471980