所以這裏有兩種可能性似乎工作。第一個在循環中使用dbSendQuery(...)
(您可能已經想到了這一點......)。
db.WriteTable = function(con,table,df) { # no error checking whatsoever...
require(DBI)
field <- colnames(df)[1]
for (i in 1:nrow(df)) {
query <- sprintf("INSERT INTO %s (%s) VALUES (X'%s')",table,field,df[i,1])
rs <- dbSendQuery(con,statement=query)
}
return(nrow(df))
}
library(DBI)
drv <- dbDriver("SQLite")
con <- dbConnect(drv)
rs <- dbSendQuery(con, statement="CREATE TABLE hash (MD5 BLOB)")
df <- data.frame(MD5=c("6717f2823d3202449201145073ab871A",
"6717f2823d3202449301145073ab371A"))
rs <- db.WriteTable(con,"hash",df)
result.1 <- dbReadTable(con,"hash")
result.1
# MD5
# 1 67, 17, f2, 82, 3d, 32, 02, 44, 92, 01, 14, 50, 73, ab, 87, 1a
# 2 67, 17, f2, 82, 3d, 32, 02, 44, 93, 01, 14, 50, 73, ab, 37, 1a
如果散列的數據幀是非常大的,那麼df.WriteFast(...)
做同樣的事情db.WriteTable(...)
只有它應該會更快。
db.WriteFast = function(con.table,df) {
require(DBI)
field <- colnames(df)[1]
lapply(unlist(df[,1]),function(x){
dbSendQuery(con,
statement=sprintf("INSERT INTO %s (%s) VALUES (X'%s')",
table,field,x))})
}
注意result.1
是一個數據幀,如果我們使用它調用dbWriteTable(...)
我們能夠成功地寫散列到BLOB。所以這是可能的。
str(result.1)
# 'data.frame': 2 obs. of 1 variable:
# $ MD5:List of 2
# ..$ : raw 67 17 f2 82 ...
# ..$ : raw 67 17 f2 82 ...
第二種方法利用的r raw
數據類型來創建結構類似於result.1
的數據幀,並傳遞到dbWriteTable(...)
。你會認爲這很容易,但不會。
h2r = function(x) {
bytes <- substring(x, seq(1, nchar(x)-1, 2), seq(2, nchar(x), 2))
return(list(as.raw(as.hexmode(bytes))))
}
hash2raw = Vectorize(h2r)
df.raw=data.frame(MD5=list(1:nrow(df)))
colnames(df.raw)="MD5"
df.raw$MD5 = unname(hash2raw(as.character(df$MD5)))
dbWriteTable(con, "newHash",df.raw)
result.2 <- dbReadTable(con,"newHash")
result.2
all.equal(result.1$MD5,result.2$MD5)
# [1] TRUE
在這種方法中,我們創建具有一個柱,MD5
,其中每個元素是原始字節的列表的數據幀df.raw
。效用函數h2r(...)
採用散列的字符表示形式,將其分解爲一個向量char(2)
(字節),然後將其中的每一個解釋爲十六進制(as.hexmode(...)
),將結果轉換爲原始結果(as.raw(...)
),最後將結果返回爲一個列表。 Vectorize(...)
是一個包裝,它允許hash2raw(...)
將向量作爲其參數。我個人認爲你最好使用第一種方法:利用SQLite的內部機制將十六進制寫入BLOB,並且它更容易理解。
閱讀源代碼,它看起來像列表被轉換爲BLOBS,但它並不明顯。我添加了一個問題,注意原始矢量應該存儲爲blob:https://github.com/rstats-db/RSQLite/issues/28 – hadley