我解析HTML文件的HTML敏捷包的幫助,從HTML文件中提取表數據。但是有一些html文件沒有可選的結束標籤,或者沒有起始標籤也是可選的。所以html敏捷包不會正確解析html頁面。如果我在記事本++中打開該html文件的內容然後使用選項TestFX-->TestFX HTML Tidy-->TiDy clean document
並使內容整潔如此。現在這個文件如果我用html敏捷包進行解析,那麼它會正確解析它。我可以在我的應用程序中使用notepad ++ exe嗎?
用記事本++使html頁面整潔是最好的選擇。
所以我不知道,但用戶不能這樣做,他們首先使用記事本++使頁面整潔,然後繼續。然後,我該怎麼辦?
編輯我已經使用HTML整潔的包,但在某些情況下,存在被整理與該文件不會被解析,但如果我讓這個頁面在記事本整潔++則解析。
我已經使用這個,但它並不總是工作。 – Harikrishna 2010-05-21 12:26:26
我該怎麼做,任何推薦? – Harikrishna 2010-05-21 12:46:50