如何使用Stata在數據位於一列時進行模糊匹配？

我在一列中有公司的名稱，因此名稱會隨着時間的推移略有變化。例如，XYZ變成XYZ & Sons。這只是一個例子，儘管這些有很多不同的變體。有成千上萬的公司名稱並手動匹配這些名稱將花費大量時間。我想做一個模糊匹配，但所有資源在線顯示如何做兩個文件之間的模糊匹配。我想知道如何做到這一點，當所有的數據在同一個文件的一列中。要匹配如何使用Stata在數據位於一列時進行模糊匹配？

一些樣本客戶名稱的例子：

鎮公司LA
鎮公司
鎮公司加拿大

感謝您的幫助！

來源

2017-06-30 sonu

我發現有用的一個選項是用戶編寫的程序strgroup。您可以從SSC安裝它：在Stata中輸入ssc install strgroup。

來源

2017-06-30 19:43:51

如何使用Stata在數據位於一列時進行模糊匹配？

回答

相關問題