5
A
回答
4
您可以使用Docotic.Pdf(我爲Bit Miracle工作)。
下面是如何在PDF文本搜索的例子:
PdfDocument doc = new PdfDocument("file.pdf");
string textToSearch = "some text";
for (int i = 0; i < doc.Pages.Count; i++)
{
string pageText = doc.Pages[i].GetText();
int count = 0;
int lastStartIndex = pageText.IndexOf(textToSearch, 0, StringComparison.CurrentCultureIgnoreCase);
while (lastStartIndex != -1)
{
count++;
lastStartIndex = pageText.IndexOf(textToSearch, lastStartIndex + 1, StringComparison.CurrentCultureIgnoreCase);
}
if (count != 0)
Console.WriteLine("Page {0}: '{1}' found {2} times", i, textToSearch, count);
}
你可能想,如果你想進行區分大小寫的搜索刪除第三個參數爲IndexOf
方法。
3
你檢查過itextsharp了嗎? http://itextsharp.sourceforge.net/
編輯: 爲了闡述,在TOC中,我看到了一個部分上: 15.3.3:與PdfReaderContentParser和PdfTextExtractor
提取文本而下PdfReaderContentParser: http://api.itextpdf.com/com/itextpdf/text/pdf/parser/PdfReaderContentParser.html 有一個選項來處理每頁的pdf內容。
因此,它似乎是一個關於方式的過程,但是您可以遍歷每個頁面,在內容中搜索所需的單詞,然後返回您找到的單詞。
相關問題
- 1. 文本搜索PDF
- 2. 搜索PDF文本文本
- 3. pdf文件文本閱讀和搜索
- 4. 搜索PDF文件中的文本
- 5. 使用C#搜索OCR(可搜索)PDF
- 6. PDF文本搜索和分庫
- 7. 文本搜索和替換PDF
- 8. PDF視圖 - 如何搜索文本?
- 9. 在iphone中搜索文本pdf
- 10. 如何編輯可搜索PDF的搜索文本?
- 11. Datagrid文本框搜索C#
- 12. 可搜索的PDF文件(圖像+文本PDF)驗證
- 13. 如何檢測pdf是文本搜索還是非文本搜索?
- 14. 如何在C#中搜索pdf中的文本(執行匹配)#
- 15. Marklogic PDF文檔搜索
- 16. Xamarin.iOS Pdf搜索
- 17. C#在文本文件中搜索
- 18. c#搜索大文本文件
- 19. Drupal 7索引pdf文件搜索
- 20. 使用Cloudera索引PDF文檔搜索
- 21. 搜索文本
- 22. 搜索文本
- 23. 調用從shell腳本彈性搜索索引pdf文檔
- 24. html/php搜索多文檔內的文本PDF文件
- 25. 搜索pdf文件中的文字
- 26. 通過文本框搜索datagridview c#.NET
- 27. c#Listview使用文本框搜索
- 28. Redis使用C完全搜索文本#
- 29. C#文本框搜索自動完成
- 30. 如何搜索PDF?
我沒有看到搜索選項itextsharp文檔。 – Shoban 2011-02-04 02:24:44
@Shoban編輯答案是更多的信息。我沒有嘗試過自己,只是建議讓OP開始。 – Joe 2011-02-04 02:32:01