我正在研究一個應用程序,我需要將.docx和.pdf文件轉換爲基本格式的.txt 文件。我在網上搜索它,但無法找到任何免費的第三方DLL。任何人都可以爲我提供最好的方式和一些dll參考。如何將.docx和.pdf轉換爲.txt文件
由於提前
我正在研究一個應用程序,我需要將.docx和.pdf文件轉換爲基本格式的.txt 文件。我在網上搜索它,但無法找到任何免費的第三方DLL。任何人都可以爲我提供最好的方式和一些dll參考。如何將.docx和.pdf轉換爲.txt文件
由於提前
http://support.microsoft.com/kb/316383描述你想要做的.docx文件非常清楚。 http://visualbasic.about.com/od/quicktips/qt/disppdf.htm描述相同,但與.pdf文件。
將文件讀入代碼後,使用VB.NET內置的文件寫入功能輸出到txt文件。
下面的代碼將爲您處理工作。這是我爲大老闆寫的哈哈。我希望它有幫助。代碼將工作表中的第一個單元格讀取爲docx文件所在的文件夾,然後將它們逐個轉換爲txt文件,並將其保存在同一個文件夾中。
Const wdFormatText = 2
If Not Len(Cells(1, "A").Value) > 0 Or Dir(Cells(1, "A").Value, vbDirectory) = "" Then
MsgBox ("Invalid Folder")
Exit Sub
End If
Dim StrFile As String
StrFile = Dir(Cells(1, "A").Value & "\*.docx")
Do While Len(StrFile) > 0
Set objWord = CreateObject("Word.Application")
Set objDoc = objWord.Documents.Open(Cells(1, "A").Value & "\" & StrFile, False, True)
objDoc.SaveAs Cells(1, "A").Value & "\" & StrFile & ".txt", wdFormatText
objWord.Quit
StrFile = Dir
Loop
感謝您的回覆。但是我已經有了一個docx文件列表。如何在oDoc對象中加載這些文件 – 2012-07-31 07:03:35
oDoc = oWord.Documents.Add(「C:\ Temp \ WordTest.docx」) – 2012-07-31 13:14:46