0
我有一些文字查找文本在HTML與正則表達式
Trotzdem gibt es Untersuchungen, die nahelegen, dass bis zu 20% der Studierenden in Deutschland während der Prüfungsvorbereitung Ritalin einschmeissen [2], Reportagen, dass britische Studierende Modafinil bestens kennen[3] und Studierende weltweit auch nach der Silk Road — einem mittlerweile eingestellten Schwarzmarkt im Deep Web – mit illegalen „Nootropics「 experimentieren.
和我有一些HTML
<p>Die <span class="caps">GDS</span> zeichnet also das Bild einer Gesellschaft, in der Drogen primär Rausch, Genuss und Spass sind. Tabak ist zwar das bekannteste – und ungesündeste – Mittel gegen Stress, aber sonst sind die Leistungssteigerer in der Liste weit abgeschlagen. Trotzdem gibt es Untersuchungen, die nahelegen, dass bis zu 20% der Studierenden in Deutschland während der Prüfungsvorbereitung Ritalin einschmeissen <a href="#_ftn2" name="_ftnref2">[2]</a>, Reportagen, dass britische Studierende Modafinil bestens kennen<a href="#_ftn3" name="_ftnref3">[3]</a> und Studierende weltweit auch nach der <a href="https://de.wikipedia.org/wiki/Silk_Road" target="_blank">Silk Road</a> — einem mittlerweile eingestellten Schwarzmarkt im Deep Web – mit illegalen „Nootropics「 experimentieren.</p>
要找到在HTML文本我產生一些瘋狂的屁股正則表達式,在那裏我斯普利特空間與
\s*?(?:<\/?[^>]*?>)?\s*?
這是在這裏看到工作的大部分時間再次加入:https://regex101.com/r/hG9lT9/1
在上面聲明的情況下,它不起作用,因爲在html標籤後面有一個逗號,並且也有不同的破折號。所以我正在尋找創建一個更一般的正則表達式來適應原因。
這裏是行不通的例子:通過https://regex101.com/r/hG9lT9/2
規則1:不要使用RegEx來解析HTML。規則2:如果您仍然想用RegEx解析HTML,請參閱規則1 – freefaller
@freefaller最終評論.. – SVK
您可以使用JavaScript從給定的HTML字符串中獲取文本http://stackoverflow.com/questions/822452/strip- html-from-text-javascript –