2009-05-20 41 views
3

什麼類型的架構,設計和軟件需要提供類似於谷歌分析提供的出色定製報告功能。更具體地說,我們希望用戶能夠從列表中指定維度和指標並生成報告。如何構建和實施自助式自定義報告?

  • 我們需要數據倉庫嗎?
  • 我們是否需要OLAP?
  • 請問數據訪問 層需要ORM,動態sql還是 存儲過程?
  • 有沒有任何第三方 派對或開源產品,可以 讓我們部分路?

是否有任何其他人(公司,開發人員)在那裏誰甚至完成谷歌的水平這一功能?例?

注意

我不感興趣,在建設一個谷歌分析競爭對手。我期望將報告的便利性應用於我們自己的獨特數據集。

感謝

+1

你是指在開發人員或公司中的其他人嗎? Omniture是谷歌分析的巨大競爭對手,甚至可能超過它們。但他們不是免費的。 http://www.omniture.com/en/ – Kekoa 2009-05-20 17:32:41

回答

1

您絕對需要一個有很多ETL,agg和pre-agg進程在非高峯時間運行的數據倉庫。 OLAP多維數據集並不能真正擴展大量的網絡分析。

對於數據收集,您可能還需要使用MSMQ或類似的硬件負載平衡。磁盤I/O是一個典型的瓶頸,所以在內存中工作,做一些預先聚合肯定有幫助。在微軟以前的工作中,我們的一些傳統數據收集系統直接登錄到日誌文件而不是數據庫。我們使用了log parser),並且在24小時內進行了大量的ETL和聚合。

數據收集是它的核心,如果你打算擴展,你將不得不建立一個最先進的數據倉庫。我們幾乎完全依賴存儲過程。我們有成千上萬個,一些令人生畏的複雜和嚴重優化。除了性能,可擴展性也是一個大問題。

0

你可能想看看http://haveamint.com/。它不是免費的,但作爲一個產品,它可以讓你主持你自己的分析。

Piwik(http://piwik.org/)是一個很好的開源實現。

就構建谷歌分析競爭對手而言,分析不會是困難的部分。如果你的服務着火,最大的困難就是在數據庫上擴展。