2016-07-14 58 views
0

我是編程新手,我已經查看過此問題的答案,但沒有一個與此特定查詢相關。在數據分析過程中沒有定義變量

我正在學習使用python分析數據。

這是代碼:

import pandas as pd 

import os 

os.chdir('/Users/Benjy/Documents/Python/Data Analysis Python') 

unames = ['user_id', 'gender', 'age', 'occupation', 'zip'] 
users = pd.read_table('ml-1m/users.dat', sep='::', header = None, names = unames) 

rnames = ['user_id', 'movie_id', 'rating', 'timestamp'] 
ratings = pd.read_table('ml-1m/ratings.dat', sep='::', header = None, names = rnames) 

mnames = ['movie_id', 'title', 'genres'] 
movies = pd.read_table('ml-1m/movies.dat', sep='::', header = None, names = mnames) 

data = pd.merge(pd.merge(ratings, users), movies) 


mean_ratings=data.pivot_table('ratings',rows='title', cols='gender',aggfunc='mean') 

我不斷收到一個錯誤說mean_ratings沒有定義......但肯定是在上面的代碼中的最後一行定義?

+0

你逝去'ratings'作爲一個字符串的'pivot_table()'函數,其中一個表的預期。刪除引號並重試。像這樣:'mean_ratings = data.pivot_table(ratings,rows ='title',cols ='gender',aggfunc ='mean')' –

+0

試過 - 仍然是同樣的錯誤! – HereItIs

+1

你能提供你收到的完整錯誤信息嗎? – DavidG

回答

1

我認爲這將工作:mean_ratings=data.pivot_table('rating',index='title',columns='gender',aggfunc='‌​mean')