我有一個輸入XML文件,其中包含各種字符的常規HTML名稱,例如Powershell - xml
<?xml version="1.0" encoding="UTF-8"?>
<OrganisationUnits>
<OrganisationUnitsRow num="8">
<OrganisationId>ACME24/7HOME</OrganisationId>
<OrganisationName>ACME LTD</OrganisationName>
<Notes>Double Quote " Single Quote &pos; Ampersand & </Notes>
<Sector>P</Sector>
<SectorDesc>Private Private & Voluntary</SectorDesc>
</OrganisationUnitsRow>
</OrganisationUnits>
後
<?xml version="1.0" encoding="UTF-8"?>
<OrganisationUnits>
<OrganisationUnitsRow num="8">
<OrganisationId>ACME24/7HOME</OrganisationId>
<OrganisationName>ACME LTD</OrganisationName>
<Notes>Double Quote " Single Quote ' Ampersand &</Notes>
<Sector>P</Sector>
<SectorDesc>Private Private & Voluntary</SectorDesc>
</OrganisationUnitsRow>
</OrganisationUnits>
我處理該文件作爲XML並得到處理好了,沒有什麼很花哨的雙引號= "
等
<Notes>Double Quote " Single Quote &pos; Ampersand &</Notes>
之前。
$xml = [xml](Get-Content $path\$File)
foreach ($CMCAddressesRow in $xml.OrganisationUnits.OrganisationUnitsRow) {
blah
blah
}
$xml.Save("$path\$File")
當輸出保存所有喜歡"
的HTML代碼得到由"
取代。 如何保留原始HTML "
個字符?更重要的是它爲什麼會發生。
該XML文件的第6行是否有''? – lit
System.Net.WebUtility.HtmlDecode和System.Net.WebUtility.HtmlEncode – jdweng
當文件被讀作[xml]時,看起來已經發生了"的替換。 – lit