2016-04-11 41 views
0

中使用XML Parse選項搜索特定字符串我正在解析公司的DEF文件並從中提取包含補償數據的表格包含此數據的表格包含一個字符串「名稱和主體位置」,它是唯一併幫助我找到表 b = xpathSApply(a,「//表[包含(。,'Name and Principal')]」) a是該頁面的HTMLParse。 a < -htmlParse(「sec.gov/Archives/edgar/data/858877/000119312515333996/...) 在某些情況下,該字符串中的間距不同我得到一個錯誤..我想搜索」名稱「」位置「單獨,看看他們有哪些表一起是唯一如何在R

xpathSApply(a,"//table[contains(.,'Name and Principal')]") 

我想,如果表中包含的姓名和校長」或‘主體地位’或其他字符串..它應該顯示.. 權現在我只能使用這個字符串.. 我正在使用XML和HTML包..

新的R,所以如果它是愚蠢的原諒

+0

請添加更多信息。例如,提供您嘗試解析的數據樣本以及您正在使用的包的名稱。你的問題不清楚,沒有更多的信息就無法提供幫助。 – lmo

+0

我解析一個公司的DEF文件並從中提取包含補償數據的表 包含此數據的表具有唯一的字符串「名稱和主體位置」,它可以幫助我找到表格 b = xpathSApply(a ,「// table [contains(。,'Name and Principal')]」) a是該頁面的HTMLParse .a <-htmlParse(「http://www.sec.gov/Archives/edgar/data /858877/000119312515333996/d95056ddef14a.htm「) 在某些情況下,該字符串中的間距不同我得到一個錯誤..我想單獨搜索」名稱「」位置「,看看它們存在的是哪個表,它們是獨一無二的 –

+0

使用XML HTML包 –

回答

0

這是行不通的? |做了OR表達...

xpathSApply(a,"//table[contains(.,'Name and Principal|Principal Position|another string')]") 
+0

不行這個不行。 此外,我試圖做出這些單詞的向量,然後搜索字符串中的向量。 示例<-c(「Name」,「Position」) xpathSApply(a,「// table [contains(。,Example )])..這也不起作用 –