2016-11-04 37 views
1

我有一個HTML文檔,mystory.html。該文件存在以下:崇高文字Html字計數器

<body> 
    <p>Hello World!</p> 
    <p>This document holds seven words.</p> 
</body> 

我希望能夠使用cmd + f,發現所有這一切都沒有通過正則表達式的HTML標籤的話。我會下載VIA包安裝一個插件,統計在HTML的話,但8(

我用下面的正則表達式,試圖做同樣的事情不存在,但它的問題是,它計數bod在正文中,如果任何標籤名稱長度大於1,則正則表達式也選擇它,代碼爲(?:)[a-zA-Z']+(?!>),這些標籤都沒有任何屬性或css基本上,我想計算文檔中不是HTML的字數。TAGS如果有誰知道一個插件,我也會接受的答案

回答

3

您可以使用正則表達式:

\b[\w']+\b(?!>) 
  • 字邊界
  • 隨後接着一個字邊界
  • 後面沒有>

這將返回7點的匹配。

html words

+0

非常感謝基思,它的工作原理! – ahitt6345