2015-05-28 91 views
1
進口

我嘗試使用下面的語法導入CSV入列家庭卡桑德拉:卡桑德拉RPC超時從CSV

copy data (id, time, vol, speed, occupancy, status, flags) from 'C:\Users\Foo\Documents\reallybig.csv' with header = true; 

的CSV文件大小約爲700 MB,並當我運行某些原因這個命令在cqlsh中出現以下錯誤:

「請求未在rpc_timeout內完成」。

什麼問題? CSV中沒有錯誤,在我看來Cassandra應該在這個CSV文件中沒有任何問題。

回答

1

Cassandra安裝文件夾有一個.yaml文件來設置rpc超時值,即「rpc_timeout_in_ms」,您可以修改該值並重新啓動cassandra。

但另一種方法是削減你的大csv文件乘法和輸入文件一個接一個。

1

這實際上最終成爲我自己對COPY-FROM的誤解,因爲CSV約爲1700萬行。在這種情況下,最好的選擇是使用散裝裝載程序示例並運行sstableloader。但是,如果我想將CSV分成17個不同的CSV(這是一個選項),上面的答案肯定會起作用。