2017-08-09 69 views
1

我正在測試新的應用程序的數據庫,我將不得不瀏覽和索引數百萬個xml文件並隨後生成這些數據的分析。SnappyData作爲操作數據庫。是否推薦?

我會在這個項目中使用SnappyData。但是,我不知道它是如何工作的。

建議這種類型的應用程序?

是否可以與Spring-Data-JPA一起使用它?

除了存儲xmls本身之外,我還希望將應用程序的其他數據(用戶和系統設置)存儲在同一個數據庫中而不是PostgreSQL中。是否推薦?

回答

1

SnappyData是一個混合分佈式數據庫,主要用於管理內存中的數據。所以,簡單的答案是肯定的。 您是否有特定的標準? Postgres也應該工作。

要加載XML,您可以使用數據框中的spark-xml project

+0

非常感謝您的回覆。 –

+0

我們的系統是一個Web應用程序,它從各種來源(電子郵件,文件系統,用戶上傳),索引和歸檔接收XML。 今天我有300個同步用戶訪問該工具並諮詢了這些數據。 我需要對這些數據做更詳細的分析,所以需要使用Spark。但我不想保留PostgreSQL和Spark。 有一些SnappyData的基本連接教程。例如一個用戶CRUD? 再次感謝您的關注。 –

+0

您可能會發現這部分文檔很有用:http://snappydatainc.github.io/snappydata/howto/ – plambre