2014-12-04 58 views
0

我正在使用打開細化來清理工作表(.csv)中的一些地址。如何在列中對完全匹配進行聚類?看來聚類算法會聚集幾乎相似的地址,這些地址只在數量上有所不同。例如:使用OpenRefine清理地址 - 羣集完全匹配

56, LORONG RENGAS, SELANGOR 
76, LORONG RENGAS, SELANGOR 
90, LORONG RENGAS, SELANGOR 
76, lorong rengas, selangor 
56, LORONG RENGAS, SELANGOR 

如何使用OpenRefine根據精確匹配集羣這些地址?問題聽起來很愚蠢,但我在這件事上失去了理智。

謝謝

回答