刪除某些XML文件條目

目前我正在處理包含數十萬個xml條目的巨大文件，在更改它們之後，我必須將它們作爲新數據庫在特定系統中上傳，文件內容如下所示：刪除某些XML文件條目

<Row ss:AutoFitHeight="0"> 
    <Cell><Data ss:Type="String">Product</Data></Cell> 
    <Cell><Data ss:Type="String">Home &gt; Connectors &gt; Power Entry</Data></Cell> 
    <Cell><Data ss:Type="Number">10430</Data></Cell> 
    <Cell><Data ss:Type="String">CAMDEN-BOSS CONTACT, 6AWG, 75A CBCAG14</Data></Cell> 
    <Cell><Data ss:Type="String">CONTACT, 6AWG, 75A; Connector Mounting:Cable; Contact Termination:Crimp; Current Rating:75A; SVHC:No SVHC (18-Jun-2012); Series:CBC; Voltage Rating:600V; Flammability Rating:UL94 V0; Wire Area Size Max:11mm; Wire Size AWG Max:6AWG; Wire Size AWG Min:6AWG&lt;br /&gt;&lt;br /&gt;&lt;strong&gt;Price for pack of: 1&lt;/strong&gt;&lt;br /&gt;&lt;br /&gt;&lt;strong&gt;Country Of Origin: CN&lt;/strong&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;http://LALA.co.uk/datasheets/1508502.pdf&quot;&gt;&lt;img alt=&quot;&quot; src=&quot;/ekmps/shops/LALA/resources/Design/icon-pdf.gif&quot; style=&quot;width: 16px; height: 16px;&quot; /&gt;&amp;nbsp;Technical Data Sheet&lt;/a&gt;&lt;br /&gt;</Data></Cell> 
    </Row>

我的工作是刪除其中沒有.pdf文件的任何鏈接的所有條目，上面的檢查結果表明它會留下，但如果不存在「http://LALA.co.uk/datasheets/ 1508502.pdf「在描述中它應該被刪除（所有行），我可以使用diferend的東西，從C＃到..所以解決方案類型無關緊要，任何人都可以給我一些建議嗎？

來源

2012-12-21 Tautvydas

你可能不能夠在記事本++或正則表達式中做到這一點。在C＃中逐行讀取文件可能更容易，並跳過那些包含但不包含pdf的行。您可以使用純字符串查找和無正則表達式來執行此操作 – Himanshu

最糟糕的是我需要刪除所有行，不僅是單元格行......我認爲可以在記事本++中這樣做，首先要更改文本行成爲一行文本沒有中斷，然後用空白代替包含文本.pdf的行，你怎麼看待它？ – Tautvydas

在記事本++查找（按Ctrl + F）

<Row[^>]*>((?!\.pdf).)*?</Row>

與

(leave blank)

「正則表達式」替換和「匹配換行符」盒子必須檢查

來源

2012-12-21 11:26:09 Placido

謝謝，你救了我的一天\！ – Tautvydas

然後請接受這個答案。 – Himanshu

刪除某些XML文件條目

回答

相關問題