2010-02-19 33 views
0

我有一個HTML文件,它有很多空白。我的問題是,在發送它之前,爲了減小文件大小,是否值得刪除這個空格?如果是這樣,刪除空白的最快方法是什麼?從HTML電子郵件中刪除空白

目前這一切都在C#中。

由於以下工作不正常我的意見,我在這裏所做的那樣:

<html> 
    <head> 
     <title>test title</title> 
    </head> 
</html> 

這就是我想要刪除,如果它是值得的開始標籤之前的間距。

回答

0

我想你的意思是刪除每行開頭的選項卡和空格。你可以使用正則表達式。檢查http://www.regular-expressions.info/examples.html爲例(在「修剪空白」下)

在你這樣做之前,我會檢查文件大小是否真的有很大的不同。

+0

除非我這樣做,不幸的是我贏了不知道。最初的文件來自一個HTML編輯器,所以它的格式可以讓Web開發人員清楚地閱讀它。 –

+0

您鏈接的示例在一行中修剪空白。 – Oded

+0

你可以將HTML複製到文本編輯器嗎?這樣你可以將它保存爲一個HTML文件。然後創建一個副本,並使用文本編輯器中的替換函數來刪除空格。然後比較文件大小。 – Pbirkoff

0

您的意思是&nbsp;
如果是這樣,使用字符串。替換功能

+0

我的意思是一般的空白。它看起來是這樣的: etiojhtat 但我想知道如果要是值得去除前導空格? –

1

如果它真的相當多的空白空間,刪除它將是很好的 - 你最終通過電線傳輸較少。

假設這主要是空格,製表符和回車,我會使用一個正則表達式,並用空格替換:

RegEx reg = new RegEx("\s"); 
string result = reg.Repalce(myHTML, " "); 

這也假定您在輸入HTML的控制,你不應該不使用正則表達式來解析HTML。

+0

爲什麼我不應該在HTML上使用正則表達式? –

+0

我沒有說你不應該使用它們,我說你不應該與他們_parse_ html。有關詳細信息,請參閱此經典SO答案:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Oded

0

這是不值得的麻煩。你基本上破壞了文件可能有的任何格式。這種格式化可能是需要的。

第一次調試文件時,當有人坐下來重新格式化文件來讀取文件時,只要你保存了文件,就會浪費掉。

如果有人花30分鐘格式化閱讀內容,您將會浪費金錢。

你也將浪費你的時間創建一個潛在的錯誤的步驟,可能會意外地刪除有效的間距,因爲使用正則表達式的HTML是不可靠的。

你會得到什麼?幾個空格和換行符被刪除?

+0

我們只是刪除空白,所以我們可以減少電子郵件的大小。我們不打算將文檔保存回磁盤。 –