2013-08-27 19 views
0

刪除谷歌分析代碼,我有一個具有3列的CSV文件:網站ID,HTML頭,HTML頁腳如何從CSV

我需要經過HTML頁眉和頁腳列和定位的任何版本Google Analytics(分析)跟蹤代碼,並將其刪除,但將這些單元格中的其他內容保留原樣。

我試過使用這個正則表達式:<script(?m:.*?)\'UA-.{8,12}\'(?m:.*?)</script>,但它似乎被拋出並刪除太多,可能來自CSV中某處格式不正確的代碼。

有更好的方法來做到這一點的任何想法?

+1

通過使用HTML解析器?另外,你在Ruby中做這個嗎?否則'm'是錯誤的標誌。無論如何,請指定您的編程語言。 –

+0

我試圖做它只是使用正則表達式查找/替換OSX上的textmate。 – Zath

+0

那麼如果這只是一件怪事,你可以嘗試用'(?:(?!

回答

1

對於一個快速的一次性替代品,您可以通過避免不重複的重複來解決它,並且從重複中允許的序列中排除<script</script。將.*?替換爲

(?:(?!</?script).)*