2013-05-20 181 views
-3

我有一個word文檔。當我上傳該文檔時,我需要從中獲取該名稱。我總是有名字的第一行中的數據在Word文檔一樣,獲取html標籤之間的數據

Shanish K 
[email protected] 
..... 
...... 

對於這一點,我只是轉換Word文件爲HTML,並從想讀的名字。一旦我將word文件轉換爲style defenitions以及實際內容。我不知道如何獲取first row中的數據。有人可以幫我從這裏出去嗎。在此先感謝...

注意: - 我注意到一些事情,當我調試時,實際內容是在段落標籤之間<p .....>Shanish</p> .....,是可能的取數據之間的第一個<p></p>

+1

你爲什麼要這麼做?我想有比將Word文檔轉換爲HTML更好的方法。 –

+0

@ RichardMarskell-Drackir可以請你給一些想法做到這一點? – shanish

+1

我可以,如果我知道*爲什麼*你試圖做到這一點。你的最終目標是什麼? –

回答

3

是的,你可以使用HTMLAgilityPackFizzlerExCSQuery

我會用FizzlerEx。加載文檔並選擇第一個匹配的p元素。

using HtmlAgilityPack; 
using Fizzler.Systems.HtmlAgilityPack; 

var web = new HtmlWeb(); 
var document = web.Load("http://example.com/page.html") 
var page = document.DocumentNode; 

var name = page.QuerySelector("p:eq(0)"); 
+0

感謝你的迴應,我會嘗試這一點,讓你知道... – shanish