2011-08-08 158 views
-1

我如何從網站html抓取文本,但只有文本而不是html?從網站抓取TEXT ONLY

我想抓住這個網站

http://kramansro.net/lunia/sites.html

我用這個代碼

TextBox1.Text = WebBrowser2.DocumentText 

但是,當我抓住它,它出來像這樣

sdfasdfad<br>asdfasdfa<br>dfasdf<br>aasd<br>fs<br>dfa<br>sdf<br>asdf<br>asd<br>f<br>as 

但我想它是這樣的:

sdfasdfad 
asdfasdfa 
dfasdf 
aasd 
fs 
dfa 
sdf 
asdf 
asd 
f 
as 
+0

看看這裏http://stackoverflow.com/questions/181095/regular-expression-to-extract-text-from-html – Im0rtality

回答

0

那麼對於特定使用情況下,最簡單的方法是

TextBox1.Text = WebBrowser2.DocumentText.Replace("<br>", vbCrLf); 

如果你有更復雜的HTML,你應該看看Regular Expressions

+0

不要我的html只是你上面看到的 –

+0

那麼這很容易:)祝你好運。 – Jordan

+0

喬丹這並沒有它並沒有改變任何東西 TextBox1.Text = WebBrowser2.DocumentText WebBrowser2.DocumentText.Replace(「
」,vbCrLf) –