我有一個名爲df_ratings
的熊貓數據框,大約有一百萬行和三列。尋找更快的方式來迭代熊貓數據幀
我想借此數據這個數據框裏面,就可以應用轉換,並把它稱爲ratings_matrix
一個numpy的矩陣裏面我寫了下面的代碼來實現這一目標:
for i in range(df_ratings.shape[0]): #fill matrix with ratings. zero = unrated
current_user = df_ratings.iloc[i, 0] - 1
current_movie = rated_movies_dictionary[df_ratings.iloc[i, 1]]
current_rating = df_ratings.iloc[i, 2]
ratings_matrix[current_movie, current_user] = current_rating
它作品,但非常緩慢。迭代for循環中的每一行數據幀都很慢。有沒有更快的方法來做到這一點?
很難說沒有任何數據。但你可以擺脫循環。 –