0
我有一個非索引數據幀(從csv文件讀取)如下:大熊貓驗證數據幀細胞
John Mullen 12/08/1993 Passw0rd
Lisa Bush 06/12/1990 myPass12
Maria Murphy 30/03/1989 qwErTyUi
Seth Black 21/06/1991 LoveXmas
我想驗證每個行的每個單元針對特定正則表達式 :
- 驗證出生日期爲
dd/mm/yyyy
- 驗證與PassRegex密碼下面
- 驗證姓/與NameRegex 下面
- 名稱替換爲「頭名_
- 等...
然後將其中的任何細胞不驗證的行新的數據框。
import re
PassRegex = re.compile(r"^(?!.*\s)(?=.*[A-Z])(?=.*[a-z])(?=.*\d).{8,50}$")
NameRegex = re.compile(r"^[a-zA-Z0-9\s\-]{2,80}$")
有沒有辦法做到這一點,而不是逐行遍歷整個數據框,並逐個單元格?
任何幫助,非常感謝。
請擴展您的問題,具體用例示例以及您當前的問題處理方法。即使僞代碼很好,你不必使其可執行。這將有助於更好地理解你的問題。 – Kartik
對於日期,您可以執行'pd.to_datetime(df ['date'],coerce = True)''這樣我就會生成'NaT',其中數據格式不正確,您可以使用這些位置來屏蔽df並將它們放置在一個單獨的DF – EdChum