我有一個只包含'a'或'g'的字符向量,我想根據頻率將它們轉換爲整數,即更多頻繁的一個應該被編碼爲0,其他爲1,例如: set.seed(17)
x = sample(c('g', 'a'), 10, replace=T)
x
# [1] "g" "a" "g" "a" "g" "a" "g" "g" "a" "g"
x[x == names(which.max(table(x)))] =
我有一個巨大的數據文件(〜2 G),需要分割成奇數行和偶數行,分別處理並寫入兩個文件,我不想讀取整個文件放入RAM中,所以我認爲一個發生器應該是一個合適的選擇。總之我想做這樣的事情: lines = (l.strip() for l in open(inputfn))
oddlines = somefunction(getodds(lines))
evenlines = somefunctio