3
我有一個非結構化郵政地址字符串和結構化郵政地址字符串的列表。 我應該用什麼來比較這些?比較結構化和非結構化郵政地址
實例地址:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
我有一個非結構化郵政地址字符串和結構化郵政地址字符串的列表。 我應該用什麼來比較這些?比較結構化和非結構化郵政地址
實例地址:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
如果僅限於發現的這些字符串是相似的,那麼你需要考慮這裏提到Finding groups of similar strings in a large set of strings
另一種方法技術的可能性 - 如果你有機會到地圖/字典,那麼你可以「結構化」任何地址(通過查找國家的名稱,郵政編碼,街道名稱等),然後比較。
祝你好運
什麼語言?另外:你能否提供一些示例地址/測試用例來證明實踐中的問題?現在這個問題太廣泛和通用。 – jsalonen
任何語言都可以。我只是想要一個適當的算法來做到這一點。 – user1471283
好的。你能提供你想要比較的地址格式嗎? – jsalonen