我正在處理一個有500,000個參與者的項目。我們在我們的數據庫中有他們家的精確座標,並且我們希望將這些數據發佈給需要它來評估的人我們的參與者彼此之間的距離有多遠。500,000組座標之間的距離矩陣
我們非常不願意發佈精確的座標,因爲這是一個匿名項目,重新識別的風險會非常高。圓形座標(像100米或1公里)顯然不夠精確,無法達到目標。
一個很好的解決方法是將500,000乘以500,000的矩陣與每對參與者之間的絕對距離發送給他們,但這意味着2500億條目,或者如果我們刪除了一半的矩陣, = | B-A |。
我從來沒有使用過這種類型的數據,所以我想知道如果有人有如何處理這個聰明的想法? (有些事情不會發送給他們2 TB的數據!)
謝謝。
你能否應用一個偏移量的數據,以便它以某種方式重新圍繞0°N和0°E?這樣計算仍然可以準確執行,但是你無法確定真實座標的位置。顯然,抵消所需的抵押品將需要保密。 – Rich