0
我遇到了一個我正在處理的應用程序的問題。 該應用程序允許用戶上傳由應用程序處理的CSV文件,然後將記錄創建爲多個表格。爲了提高性能,對於其中一個表,它會生成一個新的CSV文件,以便使用mysql LOAD DATA INFILE
功能。MySQL加載數據真的很慢/永不結束
相反,它似乎在增加處理時間。 我使用sidekiq
將所有處理推入背景。它似乎創建CSV沒有任何問題,但是當我執行load data
查詢它只是坐在那裏,我不知道它在做什麼。
我的處理函數執行以下操作:
CSV.open(output_path, 'w+', { force_quotes: true }) do |writer|
writer << headers
while rows.count > 0
....
data_sets.each do |ds|
writer << [UUIDTools::UUID.random_create, resp, row[set], ds.id, now, now]
set += 1
end
resp += 1
end
end
sql = "LOAD DATA LOCAL INFILE '#{output_path}'
INTO TABLE data_set_responses
FIELDS TERMINATED BY ',' ENCLOSED BY '\"'
LINES TERMINATED BY '\n'
(id, response_number, response, data_set_id, created_at, updated_at)"
con = ActiveRecord::Base.connection
con.execute("SET autocommit = 0;")
con.execute("SET unique_checks = 0;")
con.execute("SET foreign_key_checks = 0;")
con.execute("LOCK TABLES data_set_responses WRITE;")
con.execute(sql)
con.execute("UNLOCK TABLES;")
con.execute("COMMIT;")
con.execute("SET autocommit = 1;")
con.execute("SET unique_checks = 1;")
con.execute("SET foreign_key_checks = 1;")
截至目前,我sidekiq
進程已運行了22分鐘,仍然沒有完成。它應該插入大約700k行,這不應該接近這個長的任何地方!
我插入的表有一個二進制字段,它的主鍵(uuid),所以我不知道是否會減慢它的速度?
任何想法?
一個快速評論。我不確定他們是否修正了這個問題,但我知道我們的dbas曾指出,根據規範,UUIDTools創建的UUID不是真正的uuid。無論如何,您應該使用Ruby的SecureRandom.uuid http://www.ruby-doc.org/stdlib-1.9.3/libdoc/securerandom/rdoc/SecureRandom.html,因爲我認爲它更高性能。 – engineerDave
啊,夠公平的。我會改變這一點。儘管我正在使用的gem仍然使用UUIDTools版本:( – PaReeOhNos
)爲什麼要通過創建Rails對象直接通過Rails將CSV文件寫入數據庫? –