2015-12-22 43 views
0

我們必須通過Elasticsearch(2.1.0)和Kibana(4.3.0)分析Apache日誌。 通過Logstash在Web服務器上運行並讀取Apache組合日誌格式來解析日誌並將其發送到Elasticsearch。 所有作品都很好,但現在我們需要分析更復雜的模式。 我們有字段「purchase_id」的文件,它具有整數值(如130012,130016,133552等)。 我們有其他文件有整數字段「view_id」具有相同的值(如130012,130016,133552等)Logstash + ElasticSearch + Kibana組合來自不同領域的結果在不同的文件

這兩個字段永遠不會出現在同一個文檔中,因爲這些字段從Apache日誌中的不同URI中提取。 我們的目標是計算和可視化外觀值的「purchase_id」給定的時間框架的比例相比「的view_id」的值。 例如,讓我們說,我們要看到項目130012.目前的購買率可能出現在最後30秒在現場「purchase_id」文件1000倍,在相同的最後30秒,可能出現在文件40000次,場「的view_id 」。 這很明顯,因爲只有少量的人購買物品與暴露在產品中的人數相比。我需要計算和可視化,在時間框架有1000次purchase_id項目的130012和40000次項目130012的view_id然後通過40000分和1000乘以100%,所以我得到2.5%的可視化儀表盤上(對於項目130012)。 當然,我有很多這樣的purchase_id = view_id的=(一些號碼):詮釋對,所以我需要計算的百分比爲所有這些和顯示的,可以說20百分比最高。 這將讓我知道與我們投資的廣告相比最暢銷的商品。

回答