我正在從R轉換到Python。我剛開始使用熊貓。我有一個很好的子集R代碼:子集Python數據框
k1 <- subset(data, Product = p.id & Month < mn & Year == yr, select = c(Time, Product))
現在,我想在Python中做類似的東西。這是我到目前爲止:
import pandas as pd
data = pd.read_csv("../data/monthly_prod_sales.csv")
#first, index the dataset by Product. And, get all that matches a given 'p.id' and time.
data.set_index('Product')
k = data.ix[[p.id, 'Time']]
# then, index this subset with Time and do more subsetting..
我開始覺得我這樣做是錯誤的。也許,有一個優雅的解決方案。誰能幫忙?我需要從我擁有的時間戳和子集中提取月份和年份。也許有一條線可以完成這一切:
k1 <- subset(data, Product = p.id & Time >= start_time & Time < end_time, select = c(Time, Product))
謝謝。
感謝Philip。它運作良好。這就是我一直在尋找的 - 一個簡單,快速的解決方案。非常感謝。對於那些尋找這樣的解決方案,我使用的時間是這樣的:(data.ts> ='2012-10-01')&(data.ts <'2013-05-01')。 – user1717931
當然!樂於幫助。 –
@Philip,我嘗試了iPython的建議,在我的條件下使用了具體的值。他們工作得很好。但是,當我將其嵌入程序並調用參數時,出現錯誤 - 最後一行是:'code' File「/usr/local/lib/python2.7/dist-packages/pandas/core/series如果len(self)!= len(other):類型錯誤:未定義對象的len() – user1717931