我解析一些html代碼,我試圖用它的src值(不帶後綴)替換img中的alt當且僅當alt是空的。如果符合條件,則用另一個正則表達式替換正則表達式的選擇
例子:
輸入:
... some HTML here ....
<img src="my_image.jpg" alt="something_is_already_here" width="450" height="300">
... some HTML here ....
<img src="my_image2.jpg" alt="" width="450" height="300"
輸出:
... some HTML here ....
<img src="my_image.jpg" alt="something_is_already_here" width="450" height="300">
... some HTML here ....
<img src="my_image2.jpg" alt="my_image2" width="450" height="300">
我已經寫了src和中高音的正則表達式,但不知道如何使用它做我真正需要的東西。
//src=\"([^"]*)\.jpg\"
string srcPattern = "src=\\\"([^\"]*)\\.jpg\\\"";
//alt=\"([^"]*)\"
string altPattern = "alt=\\\"([^\"]*)\\\"";
Regex rSrc = new Regex(srcPattern);
Regex rAlt = new Regex(altPattern);
什麼'img'標籤應該受到影響(第一個是不是,爲什麼只有第二個是) ?你爲什麼依賴於正則表達式來進行HTML解析?使用HtmlAgilityPack或任何其他HTML解析器。 –
@stribizhev第一個不受影響導致alt的值不爲空。 – Dracke