我希望將使用Yahoo Pipes的TR
中的3個相鄰TD
元素的內容轉換爲以逗號分隔的值列表。來源:Epic Systems Hospitals。從XPATH提取頁面提取子元素管道
HTML片段:
...
<table width="623" cellspacing="0" cellpadding="0" border="0">
<colgroup>
<tbody>
<tr height="20">
<td width="425" height="20">Institution 0</td>
<td width="134">Minneapolis</td>
<td width="64">MN</td>
</tr>
<tr height="20">
<td height="20">Institution 1</td>
<td>Philadelphia</td>
<td>PA</td>
</tr>
...
我用 「的XPath抓取頁面」 源使用XPath正確隔離TR
元素= //tr[@height='20']
。
但是,我很難得到TD
元素。對於我而言,我不知道應該使用哪個組件,所以我選擇了使用'special variable substitution'語法的子元素。不幸的是,${td.0.content}
不起作用。
我不理解什麼?
**編輯**
我的目標是創建一個類似於XML流:
<institutions>
<institution name='Institution 0' city='Minneapolis' region='MN'/>
<institution name='Institution 1' city='Philadelphia' region='PA'/>
...
<institutions/>
從我的理解'xfetch'頁面發出'html5'內容(如您已選擇了該選項),也可以發出'strings' 。 「子元素」模塊有助於從層次結構中獲取數據,這些數據可以是XML或RSS源的形式。 – Bill 2013-05-12 19:19:15
從我引用的頁面:「目前這個模塊將提取頁面並使用Tidy修復格式錯誤的標籤。」這不表示文檔已被轉換爲XHTML嗎? – craig 2013-05-13 11:51:57