2014-04-02 65 views
-2

我正在尋找數據庫(python api)以下描述的任務。分析數據需要(易於使用)數據庫

有越來越多的數據。在初始階段積累的數據將被簡單分析,可以用簡單的sql查詢來完成。但是,未來計劃從更復雜的查詢中提取數據,找到複雜的關係。最初需要選擇一個數據存儲系統,它將來可以用來分析這個數據庫的不同,事情會變得複雜(當你探索主題和技能發展時)工具。

實施例:

首先,有於蕎麥和大米的數據。用於比較本月的銷售增長。沒問題 - 兩個sql按產品名稱查詢,採樣時間有限(月)。繪製圖形,清楚地看到是什麼。有更多種類的商品。現在,它學習如何依靠銷售增長來促進大米銷售增長。這在某種程度上可能來自使用sql查詢。現在我們在數據庫中有5000個名字,並且需要使用一些算法(例如神經網絡)自動查找數據庫中的任何依賴關係。也就是說,從簡單開始,需要成長,變得更加複雜的工具。 什麼db適合於增加需求,在開始時足夠簡單使用? 是Redis,例如?

我會非常有用的知道,在我的問題不正確。我對這個主題完全陌生。它告訴我要看什麼

+0

MongoDB應該足夠了。它正在積極用於分析廣告監測。 – vaultah

+0

除非你不能直接針對MongoDB數據庫運行SQL查詢,它也不是關係型的。 – Leigh

+0

SQL查詢不是必需的。例如,問題 – kvadrat

回答

1

我同意,MongoDB適用於此。如果您擁有數百萬個具有多個關係的條目,則SQL將在前面。但是對於成千上萬的條目,基於文檔的數據庫完成了這項工作。作爲一種好處,您在創建數據庫之前不必關心數據庫的結構,並且可以在以後輕鬆更改數據庫。看看PyMongo Tutorial

+0

您對Redis的看法如何? – kvadrat

+0

我自己並沒有使用它,但它似乎非常快,雖然也許比MongoDB更難一些,兩者之間的簡短比較就在這裏:http://stackoverflow.com/questions/5400163/when-to- Redis的,當到MongoDB的。希望能幫助到你! CU – barrios

+0

它在這裏說http://blog.mongodb.org/post/137788967/32-bit-limitations 32位MongoDB進程被限制在大約2 GB的數據。這是否意味着我無法用mongo分析25GB或更大的數據大小?或者是否有可能將其分爲幾部分? – kvadrat