2014-02-12 41 views
2

我正在尋找報告工具。數據駐留在〜6GB的postgresql數據庫中。該應用程序是一個包含項目和訂單的在線商店/目錄應用程序。利益相關者正在請求一項功能,允許他們搜索一個項目並在過去的兩年中對所有這些訂單進行計數。數據分析方法

某些行包含數量和計量單位,這些數量和計量單位需要每行的數量和計量單位的乘積。

未來還有可能需要其他報告功能。

我還沒有深入研究編程的數據分析方面。我喜歡Clojure,所以我會很高興找到一個使用Clojure的解決方案,但前提是Clojure提供滿足我需求的競爭工具。

這裏是我考慮的一些選項:

  • 僅僅SQL
  • Clojure的
    • core.reducers
    • 一個Clojure的Hadoop的庫
  • Hadoop的

任何人都可以爲我解釋這些問題的一些見解嗎?你會推薦哪些文章?

+0

[程序員](http://programmers.stackexchange.com/)可能是一個更好的地方來問這個問題。 – cpburnz

回答

1

Hadoop對於這個項目來說可能是過分的。看起來很可能僅僅使用Clojure-jdbc或Korma從數據庫中讀取數據並在Clojure中過濾/減少它可能會很好。在工作中,我們經常使用這種尺寸的序列,但這取決於預期的響應時間。如果預計會有即時響應,您可能需要進行一些預處理和緩存。