2011-03-23 76 views
1

我有很多html文檔需要在每個文檔(400+)的兩個特定區域中選擇性替換<br />標籤。 我想知道如何實現這個目標,並需要幫助。在許多HTML文檔中選擇性搜索和替換文本字符串

在每一個HTML文檔 - 標記需要<br />只在HTML標籤內所取代:
<span property="dc:description" content="xyz1,<br /> xyz2,<br /> xyz3"/>
,也是alt=" - 標籤內的<br />所有出現,就像在HTML標籤
<img src="xyz.jpg" alt="uvw1,<br />uvw2" />

在HTML-Docs的所有其他領域,<br /> -tag必須保持不變。

...我給了這個更多的想法,並認爲上述問題可以通過配備啓動信號和停止信號的腳本或函數來解決。通過這種方式,腳本知道在哪個位置開始尋找<br />-tag並將其替換爲給定的文本字符串,並且還知道在哪裏停止。然後轉到在編輯器中打開或駐留在給定文件夾中的文檔中的下一個實例。

恐怕我無法自己寫這樣的腳本。 希望有人能提供關於如何最好的完成這個的反饋,
謝謝。

OS:Win7-64,編輯:記事本++

回答

0

提供你的HTML文件不是真正的大,我不認爲你需要爲這個腳本。

你只可以:

  1. 加入的文件一起。
  2. 在Notepad ++中使用正則表達式替換。爲此,您需要將<span([^/]*)<br />(.*)"/>替換爲<span\1NEWTAG\2"/>,其中NEWTAG是您想要替換<br />的任何內容。請注意,這隻會取代每次發現的第一個<br />,因此您需要執行幾次操作,直至找不到更多。因此,如果你用包含<br />本身的文本替換(我懷疑它的聲音),你需要稍微修改一下。
  3. 將文件分割回原件。

就我個人而言,我只是寫了一個Python腳本,因爲它在字符串處理方面非常有用。但我不知道這是否在你的範圍之內。

+0

感謝您的回覆 1.將文件連接在一起不可行 – snahl 2011-03-23 14:06:35

+0

2.標籤保留,只有BR需要在標籤內被替換。 這就是你的代碼建議? 我需要在搜索字段中插入什麼,插入替換字段?對不起,我不太明白。 – snahl 2011-03-23 14:15:26

+0

用NEWTAG取代第一次運行,但在第二次運行中不起作用。需要進行哪些修改? – snahl 2011-03-23 14:26:25

相關問題