建立精確匹配字符串
我刮租房信息數據,並與大熊貓分析。我計算了平均統計數據並將它們插入到熊貓數據框中:district_df
。
其中district_df
列包含地區名稱:district_df['district']
。
另本district_df
列包含街道名稱:district_df['subdistrict']
他們的樣子,
district subdistrict
Bergen-Enkheim Bergen-Enkheim
Bornheim/Ostend Bornheim
Bornheim/Ostend Ostend
Harheim Harheim
Innenstadt I Altstadt
Innenstadt I Bahnhofsviertel
Innenstadt I Gallus
Innenstadt II Bockenheim
Innenstadt II Westend-Nord
⋮ ⋮
問題
我從district_df
每創建一個分區表(district_table
)區。即對於上述我創建了五個分區表。我用下面的代碼做這個,
for district in d_set: # d_set is a set containing all district names
district_table = district_df[district_df['district'].str.match(district)]
這段代碼的工作原理就是:創建一個每個分區的表。
但是,表Innenstadt II
也包含Innenstadt I
的小區。
在我看來,.str.match(district)
匹配不準確,但部分。即Innenstadt I
將匹配Innenstadt II
。
我的實際district_df
列包含更多然後我在這裏顯示 - 問題發生各種各樣的地區名稱。
如何獲得精確匹配?
我知道這將是愚蠢的東西很容易。謝謝。 – LucSpan
很高興能幫助你,祝你好運! – jezrael