我需要使用C#在Visual Studio 2010中創建一個winform,該C#搜索pdf文件的目錄,然後搜索pdf中的某些文本。例如,用戶可以在Winform中輸入「John Smith」。該程序需要在給定的目錄中搜索文本「John Smith」中的所有pdf。我目前沒有Adobe Acrobat,很可能無法購買它或任何非免費加載項。我被告知要查看Apache Solr和Ghostscript,但沒有看到這些如何用於winform。我已經搜索了很多,並看到了很多建議,但找不到任何簡單的示例或教程來了解如何設置用於搜索pdf的winform。有人可以提供一些關於如何在Winform中搜索PDF的示例代碼嗎?在C#winform中搜索pdfs
回答
要搜索certian文本PDF你可以在 http://sourceforge.net/projects/itextsharp/
這裏使用iTextSharp的圖書館是一個簡單的例子
var reader = new PdfReader(pdfPath);
StringWriter output = new StringWriter();
for (int i = 1; i <= reader.NumberOfPages; i++)
output.WriteLine(PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy()));
//now you can search for the text from outPut.ToString();
謝謝。任何想法如何用Ghostscript做同樣的事情?另外,我需要包含什麼來使用itextsharp(例如在頂部使用#itextsharp或將.dll複製到某個文件夾)? – boilers222 2012-07-30 13:52:22
Ghostscript是作爲Windows上的DLL構建的,因爲它作爲源提供,顯然可以重建爲靜態庫或其他組件。我對Winform一無所知,但我不明白爲什麼這應該是一個不可逾越的障礙。可以使用'txtwrite'設備提取文本。我想說GS可能是你的目的太多的大錘,如果你只想處理PDF文件,你可能會考慮使用MuPDF。 – KenS 2012-07-31 07:14:24
我使用http://www.wibit.net/blog/integrating_ghostscript_c的測試腳本將PDF轉換爲可用的ps文件。我嘗試將其更改爲文本文件(使用txtwrite),但輸出文件爲空。即使這些工作,我仍然不知道如何從C#中搜索新的PS或文本文件。任何人都可以告訴我如何做到這一點? – boilers222 2012-07-31 13:08:54
- 1. DatagridView搜索Winform - C#
- 2. 在Objective-C中使用PDFs
- 3. 在c#中搜索
- 4. 如何在WinForm上保存搜索
- 5. 搜索在c#
- 6. 搜索在C
- 7. 使用Safari瀏覽器搜索PDFs使用Applescript
- 8. 在tabcontrol中搜索tabpage C#
- 9. 文件在C#中搜索
- 10. 在ListArray中搜索C#
- 11. 在datagridview中搜索C#winfom
- 12. C#在Datagrid中搜索
- 13. 在C#中搜索DataTable#
- 14. 用c#在Soundcloud中搜索#
- 15. C++:在向量中搜索
- 16. 在C中搜索結構
- 17. 在C++中搜索CString
- 18. C#在dataGridView(Linq)中搜索
- 19. c#在多列中搜索
- 20. 如何在WinForm應用程序中實現HTML中的搜索?
- 21. 自動完成文本框有兩個選項,在C#中的winform搜索
- 22. 如何在SQL數據庫中使用WinForm進行搜索datetimepicker C#
- 23. C#Winform的數據網格錯誤搜索值
- 24. WinForm C#DataGridView的高效搜索(未綁定)
- 25. C#,WinForm在另一個winform
- 26. Windows搜索 - c中的全文搜索#
- 27. 無法搜索「C++」在谷歌搜索
- 28. Vim在C/C++代碼行中搜索
- 29. C++中的winform
- 30. 在可可中使用PDFs
我已經下載的Solr和Ghostscript,但不知道如何設置他們或在我的視覺工作室項目中使用它們。 – boilers222 2012-07-30 13:05:28