2013-11-04 65 views
0

我在2節點羣集上有一個包含147.968行(顯示「nodetool cfstats」)的ColumnFamily。編號行Cassandra-> Hadoop輸入不同

如果我執行Hadoop作業,他只在「地圖輸入記錄」上顯示90.174行?我的Hadoop CQL輸入配置是:

ConfigHelper.setInputRpcPort(job.getConfiguration(), "9160"); 
ConfigHelper.setInputInitialAddress(job.getConfiguration(), "xxx.xxx.xxx.xxx"); 
ConfigHelper.setInputColumnFamily(job.getConfiguration(), KEYSPACE, "columnfamilyname"); 
ConfigHelper.setInputPartitioner(job.getConfiguration(), "Murmur3Partitioner"); 

是否還有其他配置?

回答

1

什麼是您的輸入/輸出格式?最好使用CqlPagingInputFormat。 FTY。 cql錶行與列系列行不同,所以如果使用CqlPagingInputFormat,您應該從Cqlsh獲得相同的行數。