提前對我的英語感到抱歉。用Cassandra插入表演
我是Cassandra和他的數據模型的初學者。我試圖在本地一個節點上的cassandra數據庫中插入一百萬行。每行有10列,我只在一個列族中插入這些列。
使用一個線程,該操作需要大約3分鐘。但我想用200萬行做相同的操作,並保持良好的時間。然後我用2個線程嘗試插入2百萬行,預計在3-4分鐘內得到類似的結果。但我得到7分鐘的結果......第一個結果的兩倍。當我查看不同的論壇時,建議使用多線程來提高性能。 這就是爲什麼我問這個問題:使用多線程將數據插入本地節點(客戶機和服務器在同一臺計算機中)是否有用,只有一個列族?
一些信息: - 我用pycassa - 我已經分居commitlog劇目和數據劇目上型動物磁盤 - 我用批量插入每個線程 - 一致性等級:ONE - 複製的因素:1
你有沒有找到這個解決方案?我有類似的問題,我找不到任何解決方案。 – bwight 2013-03-25 16:40:33