0
我們正在使用U-SQL表格,並且有與羣集索引相關的問題。在U-SQL表中,並行性由數據如何分區和分配來管理。聚簇索引是否也影響U-SQL表中的並行性?其次,它如何管理分發桶中的數據偏差?U-SQL表中的聚簇索引是否影響並行性?
我們正在使用U-SQL表格,並且有與羣集索引相關的問題。在U-SQL表中,並行性由數據如何分區和分配來管理。聚簇索引是否也影響U-SQL表中的並行性?其次,它如何管理分發桶中的數據偏差?U-SQL表中的聚簇索引是否影響並行性?
集羣索引本身並不影響並行性,但是如果您使用索引查找或索引掃描根據查詢謂詞讀取數據,它可能會產生影響。因此它影響訪問頂點內數據的性能。
數據傾斜不受管理。如果你有歪斜,你將不得不尋找一個更好的分配鍵,使用skewfactor提示或使用ROUND ROBIN
分佈。