我想通過解析HTML文件與HTML敏捷性包一級的元素,例如結果會是這樣的:如何從HTML文件中的第一級元素與HTML敏捷性包&C#
<html>
<body>
<div class="header">....</div>
<div class="main">.....</div>
<div class="right">...</div>
<div class="left">....</div>
<div class="footer">...</div>
</body>
</html>
這是每個包含其他標記... 我想提取網站中存在的所有文本,但分開。例如右側分開,左側分開,頁腳等...
任何人都可以幫助我嗎?
感謝...
但你有什麼嘗試..! – Anirudha
你有一些特定的html要解析,或者你期望任何html頁面都有這個結構?你也可以通過提取文本來提供樣本嗎? –
@ lazyberezovsky:是的,任何html page.it的maens:沒有標籤的文本 –