我嘗試創建一個自定義並行提取器,但我不知道它是如何正確的。我有一個大文件(超過250 MB),其中每行的數據存儲在4行中。一個文件行存儲一列的數據。這可能爲大文件創建工作並行提取器嗎?恐怕一行的數據在文件分割後會有不同程度的變化。自定義並行提取器 - U-SQL
例子:
...
Data for first row
Data for first row
Data for first row
Data for first row
Data for second row
Data for second row
Data for second row
Data for second row
...
對不起,我的英語水平。
對不起,我無法想象。如何按順序處理這些數據?如果我將平行地從文件中逐行讀取數據(提取器allways並行讀取數據,並且AtomicFileProcessing設置爲true,我不知道爲什麼),它們將按不正確的順序排列,因爲一行的數據可能處於不同的文件範圍。這個應用程序應該做什麼? – mieszko91