我有一個DF,看起來像底部(摘錄,有4個地區和日期,每個季度擴大)彙總計算一個熊貓數據幀
我想創建一個DF(按地區)只用差異在最新日期與前一個季度和前一年(同一季度)之間
此時,兩個區域和Quradate都是索引。
,所以我想是這樣(沒有真正的接近):
(['region'] ['Quradate'][-1:-1])-(['region'] ['Quradate'][-2:-2])
& (['region'] ['Quradate'][-1:-1])-(['region'] ['Quradate'][-5:-5])
,所以我最終會與上一季度每區兩行與分數的差值1日(實際上有5分)第二個與前一年不同。
卡住...
Score1 Score2
region Quradate
North_Central-Birmingham-Tuscaloosa-Anniston 2010-01-15 47 50
2010-04-15 45 60
2010-07-15 45 40
2010-10-15 42 43
2011-01-15 46 44
2011-04-15 45 45
2011-07-15 45 45
2011-10-15 43 46
2012-01-15 51 55
2012-04-15 53 56
2012-07-15 51 57
2012-10-15 52 58
2013-01-15 50 50
2013-04-15 55 55
2013-07-15 55 56
2013-10-15 51 66
North_Huntsville-Decatur-Florence 2010-01-15 55 55
我不得不修改要添加的DIFF線(並改變「或」的大小寫,但儘管不工作EG:quarter_score_diff = region [(region.Quradate == most_recent_date)或(region.Quradate == las diff_)獲得:: ----> 8 quarter_score_diff = region [(region.Quradate == most_recent_date)或(region.Quradate == last_quarter)]。diff() 9 quarter_score_diff ['id' ] ='quarter_diff' ValueError:具有多個元素的數組的真值是不明確的。使用a.any()或a.all() – dartdog
我也刪除了原來的多餘部分),並得到相同的錯誤,例如:quarter_score_diff = region [region。Quradate == most_recent_date或region.Quradate == last_quarter] .diff()並獲得相同的值錯誤 – dartdog
希望澄清:: http://stackoverflow.com/questions/19756108/selecting-a-new-dataframe-via-一的多索引-框架中有使用大熊貓-指數-名 – dartdog