2010-07-07 71 views
2

目前我有一個帶有註釋的word文檔。文檔的結構在註釋中指定。該文件包含嵌入的圖像。在C#中讀取MS word文件帶註釋

現在我需要在結構上根據註釋讀取文檔並創建一個html文件。 問題是我不能捕獲目前的嵌入式圖像信息。

 Comments comments = doc.Comments; 
     foreach (Comment comment in comments) 
     { 
      String text = comment.Range.Text; 
      String actualText = comment.Scope.Text; 

     } 

有人可以幫助捕獲嵌入的圖像。 另外我需要文檔的確切「html」格式。目前文本顯示爲純文本而沒有任何段落信息。

回答

3

在.NET應用程序[CodeProject上]集成的Microsoft Word http://www.codeproject.com/KB/office/WordInDotnet.aspx

這可以幫助你。剛纔您檢查了API方法。我相信API中已經有方法列出所有文件,我認爲你可以通過編程來選擇HTML查看方法,然後保存它。希望有所幫助。玩的開心。

+0

感謝您的意見。 我可以使用CopyImage和ClipBoard功能來獲取圖像細節。 comment.Scope.CopyImage(); String completeData = Clipboard.GetData(DataFormats.html).ToString(); 此html內容包含臨時位置磁盤上「本地映像文件」的路徑。 另外comment.Scope.get_XML(false)將「xml」中的完整內容與圖像數據一起作爲「bindata」。 – 2010-07-07 18:34:30