2010-02-10 34 views
0

我有一組統計數據(大約100M大小),它是按鍵值對組織的,其中一些值只是數字(例如像人的年齡或體重)和有些是分層的(例如像人的僱用 - 它可以有一組僱傭記錄,每個記錄又包含關鍵/值對等)。真實的數據並不完全是這些,但結構相似。用於鬆散結構化數據的數據瀏覽/查詢工具

我需要用任意一組標準來查詢這些數據 - 也就是說我可能想問一些問題,比如「3年前最老的人在哪裏工作」或者「所有曾工作過的人的所有工資總和是多少X公司一年以上「,或者」給我所有關於最近找到新工作的人的信息「等。

我可以很容易地編寫每個單獨的查詢,但由於可以有很多這樣的查詢,所有的時間都會變得單調乏味地重新編程,所以問題是如果有一個現有的工具可以使我更容易地做這樣的查詢(如果它有一個很好的圖形用戶界面是一個獎金:)。像SQL這樣的東西不能很好地工作,因爲數據字段沒有真正修復,並且使SQL中的層次結構工作會讓IMHO變得非常麻煩。那麼是否有一種工具可以相對輕鬆地用於此任務(即,不會爲此學習一種全新的語言 - 那麼我最好繼續手動編碼查詢)?

回答

0

你可能想看看MongoDB。它是一個JSON數據存儲,所以它基本上與鍵/值對一起工作,並且可以在JSON中嵌套JSON。它使用JavaScript作爲查詢語言。當然,您需要將數據轉換爲JSON,但這並不困難。

另一種選擇可能是像Neo4j這樣的圖形數據庫。每條記錄都是一個節點,您可以定義節點之間的關係(可視化爲邊)。

我不認爲這些都有任何類型的GUI,但它們很容易查詢。 MongoDB使用JS和可用於調用數據庫的綁定。 Neo4j使用Java,但是有一些其他語言的綁定。

SQL查詢將是具有挑戰性的,但它會工作。我也會拋出PostgreSQL作爲選項,因爲它有點面向對象,但我更熟悉其他。