2
維基說:散列連接性能起源
先準備較小關係的哈希表。哈希表 條目由連接屬性及其行組成。因爲通過對連接屬性 應用散列函數來訪問散列表 表,通過使用 此表,通過掃描原始關係可以更快地找到給定連接屬性的行。
看起來好像這個連接算法的速度是由於我們散列R(較小的關係)而不是S(其他較大的一個)。
我的問題是我們如何比較散列版本的R行到S而不運行S上的散列函數呢?我們是否假設DB爲我們存儲一個? 或者我錯誤地假設沒有散列S,並且速度優勢是由於比較散列(獨特,小)而不是通過讀取行的實際數據(不唯一,可能很大)?