2013-07-31 74 views
3

美國的上市公司每季度提交10-Q報告和年度報告(10-K)。在大多數情況下,他們將每年提交三個10Q和一個10K。提取多個季度的季度數據

在大多數情況下,季度報告(10Q)包含季度數據。例如,「截至2005年3月31日的三個月的收入」。

年度申報通常只會有年終結算。例如:「截至2005年12月31日的十二個月的收入。」

爲了得到2005年第4季度的價值,我需要拿出年度數據並減去每個季度的數值(Q1-Q3)。

在某些情況下,每個季度數據均表示爲年初至今。例如,第一季度申報是「截至2005年3月31日的三個月的收入」。第二個是「截至2005年6月30日的六個月的收入」。第三個「截至2005年9月30日的九個月的收入」。每年如上所述,「截至2005年12月31日的十二個月的收入。」這代表了上述問題的普遍性,其中期望是提取季度數據,其可以通過重複減去先前的週期數據來完成。

我的問題是大熊貓完成這個季度數據提取的最佳方式是什麼?

每個時期都有大量的領域(收入,利潤,曝光等)。

一個相關的問題,我問關於如何表達大熊貓這一時期的數據:Creating Period for Multi Quarter Timespan in Pandas

這是第一個問題(三級10Qs和一個10K其中只有年末數據)的一些示例數據:

10Q:

10K:

Calcbench指的是這個問題:http://www.calcbench.com/Home/userGuide:「Q4計算:企業往往不報告第四季度的數據,而選擇加入報告全年數據代替。我們會自動爲您計算。以藍色計算數據。

將有多年的數據,每年爲我要計算丟失的第四季度:

  2012Q2 2012Q3 2012Y 2013Q1 2013Q2 2013Q3 2013Y 
Revenue  1  1  1  1  1  1  1 
Expense  10  10  10  10  10  10  10 
+0

你認爲你可以提供一些虛擬數據嗎? –

回答

0

你可以定義一個函數來從每年的號碼減去每季度彙總,然後應用函數添加到每一行,將結果存儲在新列中。

In [2]: df 
Out[2]: 
     Annual Q1 Q2 Q3 
Revenue  18 3 4 5 
Expense  17 2 3 4 

In [3]: def calc_Q4(row): 
    ...:  return row['Annual'] - row['Q1'] - row['Q2'] - row['Q3'] 

In [4]: df['Q4'] = df.apply(calc_Q4, axis = 1) 

In [5]: df 
Out[5]: 
     Annual Q1 Q2 Q3 Q4 
Revenue  18 3 4 5 6 
Expense  17 2 3 4 8