我處理表「內容」與用戶定義的函數「TrasformData」U型SQL - 如何增加parallelizm一個緩慢的UDF
@result =
SELECT Id,
TrasformData(Data) AS TrasformedData
FROM Content;
表「內容」是大(約100M記錄)和「TrasformData」功能很慢。該功能非常複雜,一條記錄大約需要20毫秒。
Azure Data Lake將我的查詢劃分爲25個Vertices爲默認值。這不夠。 25 AU可能需要幾個小時才能完成。我想爲這個過程分配至少200 AU,並儘可能快地完成它。據我瞭解,爲這個查詢分配多於25個AU直到它分成25個頂點是毫無用處的。
我可以以某種方式增加查詢的並行性嗎?有誰能幫我解決這個問題嗎?任何選項都可以接受。
謝謝你很快的回答,邁克爾!這正是我所尋找的。 –