2017-04-21 45 views
3

我想根據聲明的類型提取財務報表信息。Arelle Webserver - 如何從XBRL報表中提取利潤表?

讓我稍微詳細地向你解釋一下。

我想從XBRL實例中提取利潤表,資產負債表和現金流量表 - 特別是美國公認會計原則。

對我來說,完美的解決方案是在XML文件中的標籤以這樣的方式,我可以用標籤<incomestatement>提取利潤表,與<balancesheet><cashflow>現金流的資產負債表。

請幫我這裏。我是一名新手,在XBRL中沒有太多背景知識。

回答

1

幸運的是,提取財務報表並不困難。這裏是我是如何能夠提取損益表信息:

  1. ,如下圖所示使用arelle Web服務器,以獲得完整的事實表: http://localhost:8080/rest/xbrl/view?file=c:/Python/SEC-EDGAR/sec/2017/01/0001530425-0001477932-17-000505-xbrl.zip&view=factTable&media=xml

替換文件=「」參數與自己的路徑。您還可以對文件的參數

  • 一旦你有了XML格式,提取物作用的節點,其中對損益表,你可以看看「StatementsOfOperations」 XML事實表替代網址。儘管收益聲明角色ID有一些變化,但並不是那麼多。
  • Screenshot

    1

    至於我記得,看在正確的地方與這些角色相關聯的用戶友好的標籤。美國證券交易委員會限制這些標籤的外觀(例如,Edgar申請手冊的第6.7.12段),例如, 02 - Statement - Balance Sheet。損益表,現金流量表和資產負債表通常在Statement(相對於DisclosureDocument,Schedule)兩個破折號之間的標籤中找到。

    標籤本身的第三部分將告訴您在哪裏可以找到損益表/現金流量表/資產負債表,但是確切的標籤可能因報價者而異。此外,還有幾種類型(合併與非合併,分類與未分類等),並且複雜性進一步增加,因爲有時相同的文件可能包含若干版本(合併爲未合併),因此您需要一些領域的專業知識來決定你需要哪一個。

    簡而言之,您需要對真實存檔進行一些試驗和錯誤操作,才能找到正確的算法來過濾這些標籤。

    儘管如此,查爾斯霍夫曼已經做了一些研究,例如can be found here(第1.5節)。