2010-02-16 80 views
0

我有一些問題與匹配的文本從HTML頁面提取數據。這裏是我到目前爲止,但plainText保持爲空:c#Regex.Match問題

private void Scrape() 
{ 
    // create variables 
    string html; 
    string plainText; 

    // download page source 
    // sample URL: http://freekeywords.wordtracker.com/?seed=test&adult_filter=remove_offensive&suggest=Hit+Me"; 
    html = webBrowser1.Document.Body.InnerText; 

    // scrape keywords 
    plainText = Regex.Match(html, @"class='k'[^x]display: none""", RegexOptions.IgnoreCase).Groups[1].Value; 

    //plainText = Regex.Replace(plainText, @"\,", Environment.NewLine); 
    //plainText = Regex.Replace(plainText, @"""", ""); 

    this.richTextBox1.Text = html; 
} 
+2

是否有充分的理由使用正則表達式來解析HTML而不是使用HTML解析器? –

回答

0

您嘗試從集團獲得價值與指數1,但你的正則表達式不包含任何組。用戶組[0],或簡單地Match.Value。

+0

順便說一下,我懷疑你的html確實包含類似的代碼片段'k [not x] display:none「 – necrostaz