0

我有Application Insights的事件日誌,其中記錄事件並將其存儲爲存儲在BLOB存儲中的文本文件中的json。我需要找到customProperty滿足條件的那些jsons。命中jsons的數量非常少(約10或20),但記錄的數據非常大。任何建議如何有效地完成這項工作?應用程序洞察日誌分析

我已經在Microsoft文檔中看到HDInsights理解blob存儲並且效率很高。這與我的情況有關嗎?如果是這樣,有人可以提供一些起點。

回答

0

HDInsight是Hadoop兼容的實現,它是一種很好的日誌分析技術。關於遙測的AppInsighs頁面上也有being stated。 「在更大規模的情況下,考慮HDInsight - Hadoop集羣,HDInsight提供了各種管理和分析大數據的技術。」

在同一頁上,您可以找到有關將AppInsights遙測連續導出到Azure Blob存儲的信息。

下一步可能是使用HDInsight進行分析,但它需要您執行某種算法。

要從Azure Blob上傳數據到HDInsight,您可能會看到that link(和this用於查詢)。

要了解日誌處理管道(這是Hadoop/HDInsight的常見任務),可以使用一些演練和手冊,例如this。但是您需要根據您的情況調整此算法。

+0

要使用來自HDInsight的Application Insights,首先需要將日誌導出到blob存儲。這必須是HDInsight已配置爲可以看到的blob存儲。然後,您需要一些方法來告訴HDInsight有關文檔結構的信息。令人高興的是,如果你在HDInsight上使用Spark,它可以自己計算出JSON結構。 –

+0

現在,https://azure.microsoft.com/en-us/documentation/articles/hdinsight-spark-analyze-application-insight-logs/上提供了一個文檔,其中提供了一些關於使用HDInsight上的Spark執行此操作的指導和示例。 –