0
我正在使用打開細化來清理工作表(.csv)中的一些地址。如何在列中對完全匹配進行聚類?看來聚類算法會聚集幾乎相似的地址,這些地址只在數量上有所不同。例如:使用OpenRefine清理地址 - 羣集完全匹配
56, LORONG RENGAS, SELANGOR
76, LORONG RENGAS, SELANGOR
90, LORONG RENGAS, SELANGOR
76, lorong rengas, selangor
56, LORONG RENGAS, SELANGOR
如何使用OpenRefine根據精確匹配集羣這些地址?問題聽起來很愚蠢,但我在這件事上失去了理智。
謝謝
謝謝,我觀看了視頻,並且在破解了我的頭腦之後,我終於設法通過調整參數進行聚類。 – antsemot 2014-12-12 05:00:37