2016-01-29 40 views
0

我有以下文件閱讀不同格式的文件有效r中

*NEWRECORD 
MH = Public Service Announcements as Topic 
AQ = CL EC ES HI LJ SN ST TD UT 
MN = L01.143.805 
UI = D066308 

*NEWRECORD 
RECTYPE = D 
MH = Public Service Announcements 
MN = V02.736 
MH_TH = NLM (2016) 
ST = T170 
DA = 20150701 

的格式基本上我上面有我的文件內容。我的目標是獲得MH和MN值。該文件很大,主要以上述格式。

+1

我會尋找一個解決方案,使用sed或awk預處理文件。 – Roland

回答

1

Will這樣的工作?

d <- readLines('mydata.txt') # Read in data 
out <- strsplit(d[grep(pattern = "MH|MN", x = d)], ' = ') #Look for those lines 
do.call(rbind, out) # Bind it together 

如果您想指出它來自哪個記錄,您可能需要在將它綁定在一起之前添加一個id列。