2012-01-21 63 views
3

我即將開始爲電子商務網站開發一個網站分析工具。建立一個網站分析工具的建議(最好是Python友好) - OLAP/Python

我要記錄幾個不同的事件,基本上點擊頁面和頁面視圖的各種元素。

這些事件攜帶元數據(登錄用戶的用戶名,他的國家,他的年齡等),並且頁面本身攜帶其他元數據(類別,子類別,產品等)。

我的公司希望像OLAP多維數據集,能夠回答這樣的問題:

有多少客戶從X國訪問Y類? 2012年1月x類別的瀏覽量爲多少? x國家有多少客戶訪問過類別y?

我的理解是我應該使用OLAP引擎來記錄這些事件,然後構建一個報告界面以允許我的同事使用它。

我對不對?你有關於我應該使用的引擎和前端/報告工具的建議嗎?我是一名Python程序員,所以任何對Python友好的東西都會很好。

謝謝!

+0

Django有一些解決方案。您可能會發現這個有趣的其他問題:http://stackoverflow.com/questions/469200/any-python-olap-mdx-orm-engines – charlax

回答

2

主要問題是您的多維數據集將會有多大,以及您是否需要開源OLAP解決方案。

如果你正在處理大塊立方體,並希望爲未來的功能騰出空間,你可能會去真正的OLAP Server。一些是開源的 - Mondrian - 其他有一個'有限'社區版 - Palo,icCube。這裏重要的一點是與MDX和XMLA兼容。事實上的OLAP標準,所以你可以插入不同的報告工具和/或使用現有的庫。我的理解是,在Java或.NET中不存在用於XMLA庫的Phyton版本,但不確定這是要走的路。

如果你的立方體很小,你可以自己開發一些東西,或者像Charlax的評論所指出的那樣尋求其他更快的解決方案。

2

正如所選答案中所述,這取決於您的數據量。但是,只要遇到輕量級Python OLAP框架就足夠的情況,那麼您可以嘗試Cubes,源代碼位於github。它包含SQL後端(也可以實現其他任何其他),並提供了一個光源HTTP OLAP server。使用它的應用程序示例(使用HTTP Slicer OLAP服務器後端的PHP前端)可以找到here它不包含可視化層和複雜的查詢思想,但是這是一個小的權衡。

相關問題