我保存的HTML頁面文字,我想使用正則表達式的文件拔出名之間的空白。沒有什麼東西會被退回,我想是因爲元素之間的空白。我試圖在span和anchor之間添加\s*
。請幫我解決它......正則表達式元素
下面是HTML的例子:
<li>
<span class="name">
<a href="/players/player-name.html">Stanley, Kyle</a>
</span>
</li>
我使用C#,這裏是我的代碼:
static void Main(string[] args)
{
using (StreamReader r = new StreamReader(@"textfile.txt"))
{
string content = r.ReadToEnd();
Regex r1 = new Regex("<span class=\"name\"><a.*>(.*?)</a></span>");
MatchCollection mc = r1.Matches(content);
foreach (Match m in mc)
{
Console.WriteLine(m.Groups[1].Value);
}
}
Console.ReadLine();
Console.WriteLine();
}
所以你試着添加'\ s *'。你能向我們展示一個你如何做到的例子嗎?另外,不要用正則表達式解析HTML。使用[Html Agility Pack](https://htmlagilitypack.codeplex.com/)或其他。 – Ryan
注意,如果你沒有使用原義字符串或雙反斜線,它會剛剛結束一樣's'。所以'@ 「的 \ S *(。*?) \ S * 」'和介意'@'。 –
Ryan
謝謝你,我說: @ 「的 \ S * \ S * (*?)」 - 和它的工作!完美!!! –