我正在尋找如何有效地查詢大量數據的好資源。大型數據處理技術和書籍
每個數據項表示爲許多不同的屬性,如數量,價格,歷史信息等。客戶端將提供不同的查詢條件,但不需要更改數據集。通過簡單地將所有數據存儲到MS中,SQL並不是一種好的方法b/c MS SQL的可擴展性並不好。在這裏,我們針對許多tera字節數據,需要200-300個CPU羣集。
我對良好的資源或書籍感興趣,至少我可以做一些研究。
我正在尋找如何有效地查詢大量數據的好資源。大型數據處理技術和書籍
每個數據項表示爲許多不同的屬性,如數量,價格,歷史信息等。客戶端將提供不同的查詢條件,但不需要更改數據集。通過簡單地將所有數據存儲到MS中,SQL並不是一種好的方法b/c MS SQL的可擴展性並不好。在這裏,我們針對許多tera字節數據,需要200-300個CPU羣集。
我對良好的資源或書籍感興趣,至少我可以做一些研究。
這個問題可能會被關閉,但可以嘗試查看NoSQL數據存儲,如HBase或CouchDB。 – CanSpice
爲什麼你說MS SQL不夠好?那麼其他SQL數據庫呢?你有沒有做過任何評估? –