2017-08-17 199 views
4

我有代表表被交給我這個樣子轉嵌套列表

> l = list(list(1, 4), list(2, 5), list(3, 6)) 
> str(l) 
List of 3 
$ :List of 2 
    ..$ : num 1 
    ..$ : num 4 
$ :List of 2 
    ..$ : num 2 
    ..$ : num 5 
$ :List of 2 
    ..$ : num 3 
    ..$ : num 6 

列表結構,我想將其轉換爲這個

> lt = list(x = c(1, 2, 3), y = c(4, 5, 6)) 
> str(lt) 
List of 2 
$ x: num [1:3] 1 2 3 
$ y: num [1:3] 4 5 6 

我寫了一個功能,它以一種非常簡單的方式使用Reduce,但我覺得必須有一個更聰明的方法來做到這一點。

任何幫助表示讚賞,感謝


基準

謝謝大家!非常感激。基準的答案,拿起最快獲得較大的測試用例:

f1 = function(l) { 
    k <- length(unlist(l))/length(l) 
    lapply(seq_len(k), function(i) sapply(l, "[[", i)) 
} 

f2 = function(l) { 
    n <- length(l[[1]]) 
    split(unlist(l, use.names = FALSE), paste0("x", seq_len(n))) 
} 

f3 = function(l) { 
    split(do.call(cbind, lapply(l, unlist)), seq(unique(lengths(l)))) 
} 

f4 = function(l) { 
    l %>% 
    purrr::transpose() %>% 
    map(unlist) 
} 

f5 = function(l) { 
    # bind lists together into a matrix (of lists) 
    temp <- Reduce(rbind, l) 
    # split unlisted values using indices of columns 
    split(unlist(temp), col(temp)) 
} 

f6 = function(l) { 
    data.table::transpose(lapply(l, unlist)) 
} 

microbenchmark::microbenchmark(
    lapply  = f1(l), 
    split_seq = f2(l), 
    unique  = f3(l), 
    tidy  = f4(l), 
    Reduce  = f5(l), 
    dt   = f6(l), 
    times  = 10000 
) 

Unit: microseconds 
     expr  min  lq  mean median  uq  max neval 
    lapply 165.057 179.6160 199.9383 186.2460 195.0005 4983.883 10000 
split_seq 85.655 94.6820 107.5544 98.5725 104.1175 4609.378 10000 
    unique 144.908 159.6365 182.2863 165.9625 174.7485 3905.093 10000 
     tidy 99.547 122.8340 141.9482 129.3565 138.3005 8545.215 10000 
    Reduce 172.039 190.2235 216.3554 196.8965 206.8545 3652.939 10000 
     dt 98.072 106.6200 120.0749 110.0985 116.0950 3353.926 10000 
+0

什麼是背後的邏輯要輸出?包含三個項目的兩個向量列表或向量列表? – PoGibas

+0

兩個向量的列表,但一般n個向量 –

+0

所以你可以有x,y,z向量在最後? – Sotos

回答

4

對於具體的例子,你可以使用這個非常簡單的方法:

split(unlist(l), c("x", "y")) 
#$x 
#[1] 1 2 3 
# 
#$y 
#[1] 4 5 6 

它回收上的X-Y矢量和分裂。


它推廣到每個列表中的「N」的元素,你可以使用:

l = list(list(1, 4, 5), list(2, 5, 5), list(3, 6, 5)) # larger test case 

split(unlist(l, use.names = FALSE), paste0("x", seq_len(length(l[[1L]])))) 
# $x1 
# [1] 1 2 3 
# 
# $x2 
# [1] 4 5 6 
# 
# $x3 
# [1] 5 5 5 

這是假設,即對l頂層的所有列表元素具有相同的長度,如你的例子。

2

我們可以使用

library(tidyverse) 
r1 <- l %>% 
     transpose %>% 
     map(unlist) 
identical(r1, unname(lt)) 
#[1] TRUE 
+2

類似的東西:'data.table :: transpose(lapply(x,unlist))''。 – mt1022

4

這裏是一個想法與unlisting每個列表即

split(do.call(cbind, lapply(l, unlist)), seq(unique(lengths(l)))) 

賦予,

$`1` 
[1] 1 2 3 

$`2` 
[1] 4 5 6 
+1

謝謝 - 這比接受的答案稍慢,這就是爲什麼我選擇另一個:) –

1

在兩行使用Reducesplit第二基R法是

# bind lists together into a matrix (of lists) 
temp <- Reduce(rbind, l) 
# split unlisted values using indices of columns 
split(unlist(temp), col(temp)) 
$`1` 
[1] 1 2 3 

$`2` 
[1] 4 5 6 

此假定每個列表項具有相同數量的元素。如果需要的話setNames您可以在第二行中添加名稱:

setNames(split(unlist(temp), col(temp)), c("x", "y")) 
1

sapply提取創建數值向量的l各成分的第i個元素及lapply應用它超過1:2(因爲有在每l分量k = 2元素)。

如果你知道k是2,那麼第一行可以用k <- 2代替。還要注意,在第一行中,我們除以max(...,1)以避免在l是零長度列表的情況下被0除。

下面的代碼給出了問題中顯示的輸出;但是,主題涉及嵌套列表,如果我們需要列表而不是數字向量列表,那麼我們可以用lapply替換sapply

k <- length(unlist(l))/max(length(l) , 1) 
lapply(seq_len(k), function(i) sapply(l, "[[", i)) 

,並提供:

[[1]] 
[1] 1 2 3 

[[2]] 
[1] 4 5 6