2013-02-18 53 views
0

我有一些HTML文件需要編輯。 我需要在文件中找到一些值並對其進行清理。如何使用Perl在字符串中查找並清除子字符串?

,比如我有HTML文件:

 
    . 
    . 
    Diagnostics 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 

    Configuration 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
    . 
    . 

我需要找到和清潔

 
    Diagnostics 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 
     align="right" 

從我的HTML文件。

這是一種簡單而快速的方法嗎?

謝謝。

+1

如果您希望html標記可見,則需要使用Markdown格式將文本設置爲代碼字段。 – TLP 2013-02-18 14:59:17

回答

2

查看一個模塊,例如HTML::TreeBuilder,用於在Perl中解析HTML。這不是一個非常簡單的任務,但鏈接的文檔有一些例子。如果遇到問題,我建議你嘗試一下並提出具體問題。其他方法是使用regular expressions。這通常不建議用於解析HTML - 不可能用正則表達式可靠地解析任意的HTML。 但是,如果您只是想從具有可預測格式的文件中快速刪除某種文件,它可能是一個不錯的選擇。只要確保你的問題真的如你認爲的那樣簡單,然後再沿着這條路線走。

相關問題