這似乎應該很容易,但我似乎無法找到我在找什麼...我有兩個人名單,名字,姓氏,出生日期,我只想知道哪些人在這兩個列表中,哪一個在一個列表中,而不在另一個列表中。像基於姓名和出生日期的匹配列表
common = pd.merge(list1, list2, how='left', left_on=['Last', 'First', 'DOB'], right_on=['Patient Last Name', 'Patient First Name', 'Date of Birth']).dropna()
我已經試過一些基於別的東西,我在網上找到的,但它給我這個錯誤:
KeyError: 'Date of Birth'
我已驗證這確實是列標題在第二個列表中,所以我沒有得到什麼錯誤。任何人都這樣匹配?什麼是最簡單/最快的方式?列表之間的名稱可能有不同的格式,如「史密斯瓊斯」與「史密斯瓊斯」與「史密斯瓊斯」,但我通過從名稱中剝離所有的間諜和標點符號來解決這個問題......我認爲這是第一個好的步?
查找到集工會和分歧。 – adeora