我使用豬加載使用CqlStorage從卡桑德拉數據。我有4個數據節點,每個節點可以有7個映射器,在Cassandra中有大約3000萬個數據。當我運行像這樣增加映射器在豬
LOAD 'cql://keyspace/columnfamily' using CqlStorage
需要27名映射器來運行。
但是,如果我給where子句中負載的功能就像
LOAD 'cql://keyspace/columnfamily?where_clause=id%3D100' using CqlStorage
總是需要一個映射。
任何一個可以幫助我從你在那裏同樣的地圖輸入條款只會是一個關鍵的增長映射
[在Hadoop中更改文件拆分大小]的可能重複(http://stackoverflow.com/questions/9678180/change-file-split-size-in-hadoop) –
這是專門針對具有where子句的CqlStorage,儘管我試圖改變分割大小,但仍然只有一個映射器。 **注:只有在我包括where條款的情況下。** – Shri