2015-10-29 42 views
-1

我在管理我的論文(這是關於房地產投資信託基金期權的隱含波動表面)管理數據集時有一個棘手的問題。我應該找到公司的名稱(包括其中列出的選項),這些公司並非REITs,其市場上限與我已擁有的REITs列表類似。我有一個非常大的數據集,包含71個房地產投資信託基金的市場上限和美國上市的所有非房地產基金名稱的相同數據集(從2005年到2014年)。我被告知我應該逐年進行多對多的比賽,獲得市場上限(房地產投資信託 - 非房地產投資信託基金)的差異,並消除超出+/- 10%容差範圍的所有事情。我真的是R和Matlab的初學者,我不知道我應該如何做這場比賽。有人有什麼主意嗎? 謝謝市值匹配兩個大型數據框

+0

請您提供一個[可重現的示例]( http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example),例如與您的數據或假數據的子集? – cocquemas

+0

您需要在Treit和Tnonreit之間進行交叉連接(兩個表均爲)。 matlab中的交叉連接是這樣完成的:http://stackoverflow.com/questions/31053110/full-outer-join-of-two-tables/31068712#31068712 –

+0

'data.frame':\t 14005066 obs。 18個變量: $ X:int 1 2 3 4 5 6 7 8 9 10 ... $ secid:int 5139 5139 5139 5139 5139 5139 5139 5139 5139 5139 ... $ date:Date,format:「2010 -05-19「」2010-06-10「... .............. $ market.cap:num 2370217 2311218 2212696 2962410 2772855 ...這是結構兩個數據集之一。另一個是相似的,但名稱不同(還有更多的變量) –

回答

-1

(在matlab中)您需要在Treit和Tnonreit(兩個表的)之間進行交叉連接。 matlab中的交叉連接是這樣完成的:Full outer join of two tables 然後比較mcap_left和mcap-right並放棄給定的閾值,這會讓您的成對具有相似的mcaps