我有一個創建值列表的功能。以下是對給定從數據幀行時這樣的功能可能會做的簡化版本。DASK方法返回應用方法的字典搜索結果
def generate_key_list_pair(row):
some_list = do_something_to_make_a_list(row)
return some_list
我想那麼方法適用於所有行的數據幀DASK並返回一個字典這樣的:
ddf.apply(generate_key_list_pair)
...會返回一個詞典,其關鍵字是行ID和其值分別爲從各行的結果應用函數,例如:
{
1: [3.0, 4.12, 5.2, 23.1, 4.9],
...
n: [9.34, 8.12, 3.42, 12.1, 34.2]
}
凡1
通過n
將是從行系列對象列的值傳遞到每個generate_key_list_pair
函數調用。
編輯:1 ... N可以是唯一的標識符在原來的數據幀一列中存在。
要清楚,1..n是每個分區內的行索引值(所以它們對每個分區重複)? – mdurant
謝謝你的提問。 1 ... n可能是數據框中列中存在的唯一標識符。我可以編輯原始問題來澄清。 – kuanb