我正試圖清理一些我從Excel文件中獲得的數據。該文件包含7400行和18列,其中包括客戶列表及其各自的地址和其他數據。我遇到的問題是一些城市拼錯,扭曲了信息,並使其難以進一步處理。熊貓一次取代多個值
SURNAME | ADDRESS | CITY
0 Jenson | 252 Des Chênes | D.DO
1 Jean | 236 Gouin | DOLLARD
2 Denis | 993 Boul. Gouin | DOLLARD-DES-ORMEAUX
3 Bradford | 1690 Dollard #7 | DDO
4 Alisson | 115 Du Buisson | IL PERROT
5 Abdul | 9877 Boul. Gouin | Pierrefonds
6 O'Neil | 5 Du College | Ile Bizard
7 Bundy | 7345 Sherbrooke | ILLE Perot
8 Darcy | 8671 Anthony #2 | ILE Perrot
9 Adams | 845 Georges | Pierrefonds
在上面的例子D.DO,多拉德,DDO應拼寫多拉德-DES-Ormeaux的和IL PERROT,ILLE PEROT,ILE PERROT應拼寫ILE-PERROT。
我已經能夠使用替換值:
df["CITY"].replace(to_replace={"D.DO", "DOLLARD", "DDO"}, value="DOLLARD-DES-ORMEAUX", regex=True)
df["CITY"].replace(to_replace={"IL PERROT", "ILLE PEROT", "ILE PERROT"}, value="ILE-PERROT", regex=True)
有上述操作組合成一個的一些方法? 我已經試過:
df["CITY"].replace({to_replace={"D.DO", "DOLLARD", "DDO"}, value="DOLLARD-DES-ORMEAUX", to_replace={"IL PERROT", "ILLE PEROT", "ILE PERROT"}, value="ILE-PERROT"}, regex=True)
,但我沒有運氣