我需要從C#中的舊MS文件.doc文件中提取文本。 完成這項工作最簡單(或最好)的方法是什麼?從MS word文件處理文本的最簡單方法
2
A
回答
5
首先,您需要添加MS Word對象庫。轉到Project =>添加引用,選擇COM選項卡,然後找到並選擇「Microsoft Word 10.0 Object Library」。計算機上的版本號可能不同。點擊確定。
完成之後,您可以使用下面的代碼。它會打開一個微軟Word文檔,並顯示在消息框中的每個段落 -
// Read an MS Word Doc
private void ReadWordDoc()
{
try
{
Word.ApplicationClass wordApp = new Word.ApplicationClass();
// Define file path
string fn = @"c:\test.doc";
// Create objects for passing
object oFile = fn;
object oNull = System.Reflection.Missing.Value;
object oReadOnly = true;
// Open Document
Word.Document Doc = wordApp.Documents.Open(ref oFile, ref oNull,
ref oReadOnly, ref oNull, ref oNull, ref oNull, ref oNull,
ref oNull, ref oNull, ref oNull, ref oNull, ref oNull,
ref oNull, ref oNull, ref oNull);
// Read each paragraph and show
foreach (Word.Paragraph oPara in Doc.Paragraphs)
MessageBox.Show(oPara.Range.Text);
// Quit Word
wordApp.Quit(ref oNull, ref oNull, ref oNull);
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
}
0
根據您的需求和預算,你可能想看看Aspose.Words庫。這並不便宜,但可能會削減提取該文本所需的努力。獎金是,你不需要在你的部署計算機上安裝MSOffice(如果你在服務器上運行它,這是強制性的恕我直言)。
相關問題
- 1. 從.NET中讀取Excel和Word文件的最簡單方法
- 2. CSV文件處理Windows腳本,最好的工具,最簡單的方法?
- 3. 使用PHP從MS Word文檔中提取圖像的最簡單方法?
- 4. 什麼是加密word和pdf文件的最簡單方法?
- 5. jQuery處理MS Word文本粘貼到html文本區
- 6. 讀取文件,並用Word類處理單詞,方法
- 7. 處理bibtex文件的最佳方法
- 8. 從VBA(MS Access)解密PGP加密文件的最簡單方法
- 9. 獲取批處理文件的文件夾名稱(版本號)的最簡單方法是什麼?
- 10. 將文本文件中的特定單詞複製到MS Word的批處理文件
- 11. 從文件中提取文本的更簡單的方法
- 12. 簡單的方法來處理java包文件夾?
- 13. 最簡單的輸出簡單MIDI文件的方法?
- 14. Ruby - 讀取zip文件中文本文件的最簡單方法
- 15. 最簡單的方法來處理OPTIONS方法?
- 16. 從Django發送文本最簡單的方法是什麼?
- 17. MVC2:什麼是從文本框回發最簡單的方法
- 18. 簡單的批處理文件問題
- 19. 生成本地化文件的最簡單方法
- 20. 從Java中的JSON文件讀取最簡單的方法?
- 21. MS互操作Word,Excel多個打開的文件DocumentBeforeClose處理
- 22. 最簡單的方法來處理兩個條件
- 23. 從python中的MS word文件中提取文本
- 24. 源文本包含簡單的HTML。我怎樣才能簡單地格式化MS Word中的文本?
- 25. 什麼是從gfortran讀取.dbf文件的最簡單方法
- 26. 最簡單的方式寫入文件
- 27. 從MS Word中提取文本信息
- 28. 從.Net中插入簡單數據到Excel文件的最簡單方法
- 29. MS-Word文本到Excel表
- 30. 從MS-Word中清理粘貼的文本
這是在桌面(WinForms或WPF)或Web應用程序(ASP.NET)中嗎?它有很大的不同。 –