2011-08-01 59 views
0

我即將開始個人項目。這個項目只需要讀取相當大量的數據。開始尋找數據庫建議的新應用程序

編輯 現在,我得到的數據來源是CSV格式。所以實際上沒有數據結構可言。假設它是1個主表,其他表具有指向主表的外鍵。據大小,我目前的CSV轉儲大約3 MB。也許這並不像我想象的那麼大......

編輯2 對不起,我的數字是關閉的。 3MB大約有半年的數據價值。平均大小約6MB,最大9MB。這將是從20世紀初到今天的數據。

在此應用程序的第一次迭代中不會創建數據。

我一直在閱讀很多關於一些NoSql的替代品,我真的很想開始使用其中的一種。

我知道的兩個主要的

我的問題是,對於一個應用程序,如這一個,它的技術將是最好的? NoSql或MySql?

此外,如果你可以推薦一個首選的主機,這將是偉大的。

+2

你能提供更多的信息嗎?這取決於你正在存儲的數據結構是什麼以及你通常需要做什麼樣的查詢。 –

+0

共享數據?或本地到您的應用程序? 「大」多少? – gbn

+0

更新......這有幫助嗎? –

回答

1

鑑於這是一個個人項目:真正的問題就變成了你想要學習的東西嗎?

我會說實施你的應用程序都。這樣你就可以瞭解它們的一些優點/缺點。

關於託管。下面有兩種一些託管信息:
http://www.mongodb.org/display/DOCS/Hosting+Center

https://cloudant.com/

我從來沒有和這兩個託管解決方案的工作,所以我不知道他們什麼。


另外一件事,我想澄清一下結構化數據的含義。

  1. 數據是否自然地適合行/列?
  2. 記錄是否稀疏(意思是說,記錄中不同位置是否有很多空值)?
  3. 數據自然是否有查找的共同元素? (外鍵關係)

如果1 & 3是是,2是no,那麼你的結構化程度很高。

如果2是和1 & 3不是,那麼你有非常結構化的數據。

其他任何都是某種混合類型,你必須使用你的判斷。恕我直言,數據越結構化,您應該使用的傳統DBMS越傳統。

結構化數據的一個例子是每個地區的日常溫度表。你需要一個表來保存臨時表,另一個表保存區域名的外鍵查詢。所有的列(收集的溫度,日期/時間和區域ID)通常都會被填充。

非結構化數據的一個例子是在雜貨店(大,小,紅,藍,4英寸長,盒子等)中找到的產品。這種情況下的屬性將取決於所討論產品的類型。根據商店的不同,他們甚至可能會有一款與其他商品不同的產品。

在RDBMS中有明顯的存儲方式,但基於文檔的NoSql解決方案可能會更好,因爲這種類型的信息能夠更好地查詢功能。

0

取決於你的目標是什麼。你沒有真正用一種方式描述數據,這種方式表明一種方法比另一種更好。我想說如果你想學習NoSQL,那麼繼續吧,讓這個項目成爲實現這個目標的手段。但如果你更關心項目的結果,我會堅持你所知道的。如果你知道SQL,那麼繼續在SQL中解決這個問題。如果你不這樣做,那麼無論哪種方式看起來都不錯。

相關問題