2017-06-30 29 views
0

我在一列中有公司的名稱,因此名稱會隨着時間的推移略有變化。例如,XYZ變成XYZ & Sons。這只是一個例子,儘管這些有很多不同的變體。有成千上萬的公司名稱並手動匹配這些名稱將花費大量時間。我想做一個模糊匹配,但所有資源在線顯示如何做兩個文件之間的模糊匹配。我想知道如何做到這一點,當所有的數據在同一個文件的一列中。要匹配如何使用Stata在數據位於一列時進行模糊匹配?

一些樣本客戶名稱的例子:

  • 鎮公司LA
  • 鎮公司
  • 鎮公司加拿大

感謝您的幫助!

回答

0

我發現有用的一個選項是用戶編寫的程序strgroup。您可以從SSC安裝它:在Stata中輸入ssc install strgroup