我有一組已輸入和excel電子表格的名稱和地址,但問題是許多輸入地址的人以許多不同的非標準格式輸入了它們。我希望在將所有地址傳送到我的數據庫之前清理地址。環顧四周,我真正發現的地址洗滌器(解析器或格式化器)的方式是由Semaphore推出的。出於我的目的,我並不需要所有這些,我也不想爲軟件的許可費支付費用。有沒有什麼是免費和/或開放源代碼可以幫我擦洗?開源地址Scrubber?
回答
由於我在郵寄業務工作...
可郵寄地址沒有地理編碼。一個允許USPS發送郵件,另一個告訴你該地點在哪裏。 USPS不會對其可郵寄地址進行地理編碼。這對標記區域/地區進行定位非常有用。
您並未購買該軟件的許可證,而是購買了該數據。郵局有很多規則,特別是如果你在商業上做這件事,並試圖獲得比一流的更好的速度。有關完整的規則列表,請參閱USPS Domestic Mail Manual。 USPS一直在拉鍊之間移動拉鍊和家庭。該公司(我工作)向USPS支付其更新的郵件列表,以便我們能夠更新我們的數據庫。每週。
回到你的問題。您是否想將數據更改爲常用格式(街道 - > st),或者您是否在尋找重複項,並且只想存儲真正的郵寄地址?
通用格式;你可以將地址分解成幾部分,清理空白處並應用術語/翻譯字典。然後應用一些SQL來查找重複項。請記住家庭(1個主要城市)與個人不同(John Doe,1個主要城市)。
爲郵寄地址,以及你們中的一些人(讀者)不會喜歡這個答案,但你想要的信息,這不是免費的。有人花費時間或金錢來獲取和維護這些列表。因此,找一個商業模式來獲取名單上的資金,或者找一個能爲你做的人。 Data and mail management
實際上,Semaphore是相當便宜的,只要記住地址db將不得不季度更新和$ 19 /季度是相當便宜。
另一個地址洗滌產品。 SAP PostalSoft。我不知道數據會花費什麼。
我與之合作過的大部分軟件都非常昂貴(或者換句話說,營銷部門天真並且預算龐大)。
這類工作是地理編碼的先驅。這linked Wiki article包括地理編碼軟件的列表,其中一些是免費的。如果幸運的話,一些免費的可能包括地址標準化例程。
如果你找到一個好的,請告訴我。
我們使用Accuzip。它比大多數解決方案便宜很多(約700美元/年),並附帶雙月更新。它使用USPS地址標準化API,爲此我編寫了一個.NET包裝器。這使我可以實時運行它(默認情況下,Accuzip僅帶有批處理模式)。
我居然在地址驗證行業工作NET包裝...吉姆的回答是一個聰明的接受。不幸的是,對於我們這些預算較低的人來說,美國官方的USPS數據價格昂貴且系統複雜。 (我知道的經驗,因爲我工作的公司,SmartyStreets,提供的地址驗證的速度比大多數都低)。
我可以在這裏幫助的最好的建議是一個低成本/免費的替代品(取決於您的體積),比如LiveAddress,其中地址列表沒有最低購買量,而API比較便宜且超級容易。
更新:如果您仍然需要一個好的解決方案,地址驗證API服務(在SmartyStreets)現在可以免費使用。 – Matt 2012-01-12 05:33:22
- 1. SENDTO源地址
- 2. Javascript文本框「Scrubber」
- 3. Flash Actionscript 3.0 Audio Scrubber
- 4. 開源地圖
- 5. gcc開始地址
- 6. ARM開始地址
- 7. 我想操縱源地址
- 8. MAC源地址的用途
- 9. GCDAsyncUDPSocket源地址返回null
- 10. 有沒有開源的地址解析器(位置)算法?
- 11. 開源代碼中電子郵件地址的最佳實踐?
- 12. SMPP - 使用字母數字來源地址時,來源地址爲「未知」
- 13. 0x開頭的地址
- 14. C# - 一個MAC地址,多個源IP地址
- 15. 將memcpy中的源地址和目標地址對齊
- 16. 綁定IPv6地址到Python插座作爲源IP地址
- 17. 開放街道地圖地址解碼
- 18. 開源分形地圖
- 19. 開源網址縮短軟件?
- 20. 地圖開發的地圖資源
- 21. android seekbar thumb(scrubber control)按下時剪輯
- 22. 從tcpdump獲取源MAC地址
- 23. 從TcpClient獲取源IP地址
- 24. 來自ftp地址的asp.net圖像源
- 25. 綁定CXF客戶端源IP地址
- 26. recvfrom()得到錯誤的源地址
- 27. jMeter源地址不起作用
- 28. 返回與源地址變動數
- 29. IP地址和相同來源策略
- 30. 欺騙HTTP請求的源IP地址
也許提供一些示例數據。 – Till 2008-11-17 14:21:36