我有名字的數據幀被解析:在大熊貓的數據幀與標點符號標識行
**FIRST_NAME**
Jon
Colleen
William
Todd
J.-
&Re Inc
123Trust
我創建一個列標誌的名稱,如果它是好還是壞:
df['BAD']=pd.Series(np.zeros(1),index = df.index)
**FIRST_NAME** **BAD**
Jon 0
Colleen 0
William 0
Todd 0
J-Crew 0
&Re Inc 0
123Trust 0
如果FIRST_NAME包含標點,數字或空格,我想更新BAD = 1。
**FIRST_NAME** **BAD**
Jon 0
Colleen 0
William 0
Todd 0
J-Crew 1
&Re Inc 1
123Trust 1
這裏是我的代碼:
punctuation = '!"#$%&\'()*+,-./:;<=>[email protected][\\]^_`{|}~ 1234567890'
i=0
while i <int(len(dfcopy)):
for p in punctuation1:
if (df['Bad'][i]==1):
df['Bad'][i]=1
elif(p in list(df.iloc[i,1])and df['Bad'][i]==0):
df['Bad'][i]=1
else:
df['Bad'][i]=0
i=i+1
有沒有辦法更快地做到這一點?
謝謝!我用「set」來使用你的第二個解決方案。 – jgaw 2014-10-27 19:20:24