我正在使用帶有兩個節點的Datastax Cassandra 3.1.4。我用CqlStorage()在表中運行了12百萬行的豬,但我發現只有一個地圖運行一個簡單的豬命令。Datastax Cassandra PIG只運行一個MAP
我試着在我的豬關係中改變split_size,但它沒有奏效。
這是我的示例查詢。
x = load'cql://Mykeyspace/MyCF?split_size=1000' using CqlStorage();
y = limit x 500;
dump y
我沒有找到我的mapred-site.xml中input.split.size財產我假設默認分割大小是64 * 1024
我試圖set pig.splitCombination false;
現在它採取513我從Hive嘗試了同樣的事情
我已經從Hive連接到Cassandra,並給出了一個簡單的選擇所有查詢,其中col1> value這個表只有10個記錄但仍然運行513個地圖。
請幫我在這
感謝
可能重複的[Pig&Cassandra和DataStax分裂控制](http://stackoverflow.com/questions/19575475/pig-cassandra-datastax-splits-control) – nate