2013-07-18 141 views
2

我使用很多R處理財務數據,例如, CDD價差,數據相關性,時間序列... ...如何用R讀取msg文件

現在我通過電子郵件定期從bloomberg更新數據,並且所有數據都只是在電子郵件中的文本(不作爲附件),我想寫一個函數來讀取它們的數據(數百封電子郵件,擴展名爲.msg),然後保存到excel中。

有沒有人有關於如何讀取數據的提示?我更喜歡R,但如果R不能這樣做,C++也可以工作。

這裏是電子郵件的格式(部分):>>>>>

$$ JPM CDX OPTIONS: HY19 AUG Expiry UPDATE - REF 102⅜[~354bp] 
       BOND PUT   BOND CALL 
K [~Sprd]|SEP13>PAY Dlt |SEP13>RCV Dlt |MidVol [SprdVol] 
108 [313] | 355 365 92% | 5 13  8% | 5.4% [ 40%] 
107 [335] | 243½253½ 85% | 23 36 17% | 7.8% [ 33%] 
106 [369] | 203 213 77% | 52½62½ 28% | 7.1% [ 34%] 
105 [387] | 147 167 59% | 99½116½ 41% | 9.3% [ 46%] 
+1

顯示所需的輸出 – GSee

回答

2

這是一個良好的開端:

email <- "$$ JPM CDX OPTIONS: HY19 AUG Expiry UPDATE - REF 102⅜[~354bp] 
       BOND PUT   BOND CALL 
K [~Sprd]|SEP13>PAY Dlt |SEP13>RCV Dlt |MidVol [SprdVol] 
108 [313] | 355 365 92% | 5 13  8% | 5.4% [ 40%] 
107 [335] | 243½253½ 85% | 23 36 17% | 7.8% [ 33%] 
106 [369] | 203 213 77% | 52½62½ 28% | 7.1% [ 34%] 
105 [387] | 147 167 59% | 99½116½ 41% | 9.3% [ 46%]" 
email 
ll <- readLines(textConnection(email)) 
mm <- read.table(text=ll[-c(1,2)],sep='|',header=TRUE) 

    K...Sprd. SEP13.PAY...Dlt SEP13.RCV...Dlt MidVol..SprdVol. 
1 108 [313] 355 365 92%  5 13  8%  5.4% [ 40%] 
2 107 [335]  243½253½ 85%  23 36 17%  7.8% [ 33%] 
3 106 [369] 203 213 77%  52½62½ 28%  7.1% [ 34%] 
4 105 [387] 147 167 59%  99½116½ 41%  9.3% [ 46%] 
+0

感謝您的答覆。我想我沒有說清楚。我必須處理的是.msg文件,這是一種來自MSFT的電子郵件格式(我猜)。我需要(和上面顯示的)數據是電子郵件正文中的數據。但是,我沒有從電子郵件中讀取數據的好方法。我不知道如何打開.msg文件並使用R或C++從它讀取數據。 如果我用寫字板打開.msf文件,看起來很亂 – simeonyyyyyy

+0

@ user2596245我認爲你應該用'll < - readLines(「email.msg)」替換'll < - readLines(textConnection(email) – agstudy

+0

我做到了,但它不起作用。:( 這裏是快照 [link](https://www.dropbox.com/s/tiqj1bctguvh6n4/msgFile.jpg) – simeonyyyyyy