2010-10-15 29 views
0

我在我的c項目中使用libxml2。 我想知道如何使用xpath獲取html文件中的所有表格。 示例代碼將做到這一點。如何在c中使用xpath獲取HTML表格?

我需要解析html表中的數據。

感謝

編輯:

這是表中的行:

<tr class="report-data-row-even"> 
    <td class="NormalTxt report-data-cell report-data-column-even"> 
     <nobr>0.0285</nobr> 
    </td> 
    <td class="NormalTxt report-data-cell report-data-column-odd"> 
     <nobr>&#1508;&#1512;&#1496;&#1504;&#1512;</nobr> 
    </td> 
    <td class="NormalTxt report-data-cell report-data-column-even"> 
     <nobr>SMS</nobr> 
    </td> 
    <td class="NormalTxt report-data-cell report-data-column-odd"> 
     <nobr>1</nobr> 
    </td> 
    <td class="NormalTxt report-data-cell report-data-column-even"> 
     <nobr>054-2570130</nobr> 
    </td> 
    <td class="NormalTxt report-data-cell report-data-column-odd"> 
     <nobr>00:14:09</nobr> 
    </td> 
    <td class="NormalTxt report-data-cell report-data-column-even"> 
     <nobr>27/09/2010</nobr> 
    </td> 
    > 
</tr> 

我需要能夠拉<nobr>標籤內的數據。

+0

夥計!一個簡單的谷歌搜索將給你所有這些答案! – 2010-10-15 13:01:36

回答

1

的XPath會笑着 「//表」

+0

這個伎倆。 – embedded 2010-10-15 11:46:40

+0

如何迭代表中的所有行並打印值? – embedded 2010-10-15 11:46:57

+0

您要求後代節點的表格對象爲「// tr」 – 2010-10-19 18:39:30

1

嗯,我需要更多的信息。 HTML的外觀如何?你提取什麼樣的數據?另外爲什麼C?雖然DOM創建在C中很快,但是之後字符串操作需要一些努力。爲什麼不是Python?無論如何,這裏是你可以嘗試的xpath。

//table[@class='table_class']

這給具有類名稱爲 'table_class' 你的HTML頁面中的所有表。您可以將其更改爲HTML的組織方式。

0

對於您需要使用回撥法,

的字符。

(無效)字符(XMLCHAR *)

看到的libxml文檔