如何使用F＃讀取.docx文件

如何使用F＃讀取.docx文件。如果我用如何使用F＃讀取.docx文件

System.IO.File.ReadAllText("D:/test.docx")

它返回給我一些垃圾輸出與嘟嘟聲。

來源

2011-12-31 Exception

這裏是一個F＃代碼片段，可能會爲您提供一個快速入門。它成功地提取Word2010中創建.docx文件的所有文本內容的拼接線的字符串：

open System 
open System.IO 
open System.IO.Packaging 
open System.Xml 

let getDocxContent (path: string) = 
    use package = Package.Open(path, FileMode.Open) 
    let stream = package.GetPart(new Uri("/word/document.xml", UriKind.Relative)).GetStream() 
    stream.Seek(0L, SeekOrigin.Begin) |> ignore 
    let xmlDoc = new XmlDocument() 
    xmlDoc.Load(stream) 
    xmlDoc.DocumentElement.InnerText 

printfn "%s" (getDocxContent @"..\..\test.docx")

爲了使它的工作，不要忘記在你的VS項目中引用WindowsBase.dll。

來源

2011-12-31 21:11:32

大拇指爲優雅的解決方案。現在可以切換到XDocument。 Framework 1.1將於9歲關閉，而Linq的XDom顯然更具功能性。 – 2012-01-02 20:55:24