snappydata

    1熱度

    1回答

    我正在測試新的應用程序的數據庫,我將不得不瀏覽和索引數百萬個xml文件並隨後生成這些數據的分析。 我會在這個項目中使用SnappyData。但是,我不知道它是如何工作的。 建議這種類型的應用程序? 是否可以與Spring-Data-JPA一起使用它? 除了存儲xmls本身之外,我還希望將應用程序的其他數據(用戶和系統設置)存儲在同一個數據庫中而不是PostgreSQL中。是否推薦?

    1熱度

    1回答

    我對S3獸人數據的1.2GB,我試圖做同樣的下列內容: 1)高速緩存活潑的羣集上的數據[snappydata 0.9] 2)上的高速緩存的數據集 3)比較用火花的性能執行一個查詢GROUPBY 2.0.0 我使用的是64 GB/8芯機和用於斯納皮配置集羣如下: 012現在 $ cat locators localhost $cat leads localhost -heap-size=40

    1熱度

    1回答

    我是SnappyData的新手,我試圖將大量數據導入到它中。因此,數據是從不同的來源創建的,並作爲csv文件存儲在每個位置的zip文件中。可以說,拉鍊的結構是zip1,zip2 ... zipn,每個zip包含完全相同的(header.csv,detail1.csv,detail2.csv,... detail15.csv)每個.csv具有相同的結構,這意味着zip1中的detail5.csv與z

    0熱度

    1回答

    當我創建一個新的數據庫並從Postgresql導入架構結構到SnappyData我正在處理有關如何使用來替換每個數據類型的問題。 首先使用什麼來兼容具有時間戳,真實,雙倍,長(座標)和字符串的數據? 我搜索的幫助和文檔,但沒有找到關於它的一個很好的解釋...

    1熱度

    1回答

    SnappyData文檔就如何提交一個罐子到羣集的例子: https://snappydatainc.github.io/snappydata/howto/run_spark_job_inside_cluster/ 但是,如果我需要與同一類CreatePartitionedRowTable 提交罐子什麼多次,但有不同的參數,說不同的後綴追加到創建的表名稱,我該怎麼做? UPDATE: 更確切地說,

    0熱度

    1回答

    我有我需要連接兩個表 table_A(ID, val), table_B(ID, val) 得到一個新表 RESULT(ID, value) 當值應填入這樣 案例1:如果在table_A和table_B中都存在一個ID,值應該是1, 情況2:如果ID僅存在於標籤中le_A並且不存在於表-B,值應爲0 CREATE TABLE RESULT AS SELECT A.ID, {TODO}

    1熱度

    2回答

    我正嘗試使用Zeppelin創建SnappyData流表。 我與參數 'rowConverter' 齊柏林筆記本流表定義的問題被分爲幾段: 第1款: import org.apache.spark.sql.Row import org.apache.spark.sql.streaming.{SchemaDStream, StreamToRowsConverter} class RowsCon

    0熱度

    2回答

    我想從snappydata cli運行jar文件。 我只想在開始時創建sparkSession和SnappyData會話。 package io.test import org.apache.spark.sql.{SnappySession, SparkSession} object snappyTest { def main(args: Array[String]) {

    0熱度

    1回答

    我有一個包含數百萬條記錄的列表。我只想保留最近3個月的內存,其餘的需要在磁盤上,但可以諮詢。 SnappyData可以做到這一點嗎?

    0熱度

    1回答

    我試圖通過智能連接器樣式連接到SnappyData存儲,如http://snappydatainc.github.io/snappydata/howto/#how-to-access-snappydata-store-from-an-existing-spark-installation-using-smart-connector中的描述,但得到了由java.nio引起的com.gemstone.