4
我想處理郵政編碼不容易格式化的非常大的文件(10,000+觀測)。我需要他們全部轉換成只是第5位,這裏是我當前的代碼:更快處理熊貓數據框
def makezip(frame, zipcol):
i = 0
while i < len(frame):
frame[zipcol][i] = frame[zipcol][i][:5]
i += 1
return frame
幀是數據幀,並且zipcol是包含郵政編碼的列的名稱。雖然這有效,但處理需要很長時間。有更快的方法嗎?
您需要避免使用for循環並使用'apply'方法。請參閱http://stackoverflow.com/questions/7837722/what-is-the-most-efficient-way-to-loop-through-dataframes-with-pandas – vmg