假設我有一個word文檔的內容就像下面提取指定的信息從Microsoft Word
Name: Blabla1
Address: Blablabla2
History Employment: Blablabla3
Blablabla4
Blablabla5
我的問題在這裏是如何以及什麼算法(如果存在的話)來提取這些信息納入類在C#。
Class Employee {
public string Name { get; set; }
public string Address { get; set; }
public IEnumerable<string> History = new IList<string>();
}
有什麼建議嗎?
var Employee = ExtractMethodFromDoc(docPath);
轉換爲其他格式可能不是最好的解決方案,沒有承授人在轉換過程中保留所有信息。 – David 2013-04-06 05:12:17
@David我搜索了它,但沒有找到替代品,對不起,請參閱此附加SDK,如果有幫助>> http://openxmldeveloper.org/discussions/development_tools/f/17/t/5992.aspx – Freelancer 2013-04-06 05:38:08
您的評論太過於絕對,強烈不同意,原諒我,:)。您不必使用PowerShell等腳本。例如,在Visual Studio中,您可以使用文檔級自定義(請參閱http://msdn.microsoft.com/zh-cn/library/aa942839.aspx)來訪問Word文檔的所有內容,但它不會太難將文本解析爲結構表示,例如包含所需信息的類實例。 – David 2013-04-06 07:04:54