如何用R读取msg文件

how to read msg file with R

本文关键字:msg 文件 读取 何用      更新时间:2023-10-16

我经常使用R来处理财务数据,例如cds利差、部分数据的相关性、时间序列。。。

现在我通过电子邮件从bloomberg定期更新数据,并且所有数据都只是电子邮件中的文本(而不是附件),我想写一个函数从中读取数据(数百封电子邮件,扩展名为.msg),并保存到excel中。

有人对如何读取数据有任何提示吗?我更喜欢R,但如果R做不到,C++也可以。

以下是电子邮件的格式(部分):>>>>

$$ JPM CDX OPTIONS: HY19 AUG Expiry  UPDATE - REF 102⅜[~354bp]
               BOND PUT          BOND CALL
 K [~Sprd]|SEP13>PAY   Dlt |SEP13>RCV   Dlt |MidVol [SprdVol]
108 [313] |  355 365   92% |    5 13     8% |  5.4% [ 40%]
107 [335] | 243½253½ 85% |   23 36    17% |  7.8% [ 33%]
106 [369] |  203 213   77% |  52½62½  28% |  7.1% [ 34%]
105 [387] |  147 167   59% |  99½116½ 41% |  9.3% [ 46%]

这是一个良好的开端:

email  <- "$$ JPM CDX OPTIONS: HY19 AUG Expiry  UPDATE - REF 102⅜[~354bp]
               BOND PUT          BOND CALL
 K [~Sprd]|SEP13>PAY   Dlt |SEP13>RCV   Dlt |MidVol [SprdVol]
108 [313] |  355 365   92% |    5 13     8% |  5.4% [ 40%]
107 [335] | 243½253½ 85% |   23 36    17% |  7.8% [ 33%]
106 [369] |  203 213   77% |  52½62½  28% |  7.1% [ 34%]
105 [387] |  147 167   59% |  99½116½ 41% |  9.3% [ 46%]"
email
ll <- readLines(textConnection(email))
mm <- read.table(text=ll[-c(1,2)],sep='|',header=TRUE)
  K...Sprd.  SEP13.PAY...Dlt  SEP13.RCV...Dlt MidVol..SprdVol.
1 108 [313]    355 365   92%      5 13     8%       5.4% [ 40%]
2 107 [335]     243½253½ 85%     23 36    17%       7.8% [ 33%]
3 106 [369]    203 213   77%      52½62½  28%       7.1% [ 34%]
4 105 [387]    147 167   59%      99½116½ 41%       9.3% [ 46%]