我有一個網站,將特別閱讀PHP與XML樣式文件並顯示一些內容。更新網站的人並不那麼專注,所以我希望能夠創建一個程序,將一個Powerpoint轉化爲我所需要的XML類型。C#與HTML標籤
我轉換PowerPoint - > RTF - > HTML。示例輸出如下:
<p style="text-align:center;"><span style="background-color:#FFFFFF;font-family:Calibri font-size:44pt;">Title 1</span></p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">Data in here.</span></p>
<p> </p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">More Data.</span></p>
<p> </p>
我希望逐行閱讀HTMl,解釋標籤並創建我自己的文件。
即時通訊:每個具有特定標籤的標籤將被歸類爲標題,然後任何具有另一個特定標籤的標籤將被歸類爲數據。
例Ouptut:
<FILE>
<ITEM>
<TITLE>Title 1</TITLE>
<DATA><p>Data in here</p><p> </p><p>More Data.</p></DATA>
</ITEM>
</FILE>
(如何)才能做到這一點?
注:我不是在尋找如何刪除所有標籤:Like here和and here
注2:在PowerPoint沒有一個固定的字體/字體大小。如果可能的話,我希望它完全獨立。如果這不起作用,是否可以在PowerPoint中使用固定模板來完成,因此每個標題和數據部分都是相同的,因此具有相同的標籤?
您可以使用'HtmlAgilityPack'來解析HTML。 –