我需要將.pdf(掃描)文件轉換爲.txt文件(或.doc,但更喜歡.txt)。NET C# 我該怎麼做?如何將.pdf(掃描)文件轉換爲.txt文件(或.doc,但我更喜歡.txt)在.net C#
回答
提到「已掃描」 ,我認爲這隻適用於PDF實際包含文本而非掃描圖像的情況。 – 2015-02-24 06:25:29
轉換爲txt文件時,它無法像解析文檔文件一樣解析圖像。 @SamiKuhmonen – Karthikeyan 2015-02-24 07:12:13
您可以參考此示例代碼。
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;
// ...
public static string ExtractTextFromPdf(string path)
{
using (PdfReader reader = new PdfReader(path))
{
StringBuilder text = new StringBuilder();
for (int i = 1; i <= reader.NumberOfPages; i++)
{
text.Append(PdfTextExtractor.GetTextFromPage(reader, i));
}
return text.ToString();
}
}
嗨可汗,我需要從PDF圖像文本,但你張貼從普通PDF格式的閱讀文本。 – 2015-02-24 06:30:08
我在一年前試過這個,寫了我自己的解析器,但沒有運氣。但我認爲你應該找到一種方法將圖像格式的pdf粘貼到文檔中。
我知道這不是答案,但它有助於改變你對如何達到你的要求的想法。
- 1. 使用tesseract將掃描的PDF轉換爲.txt文件
- 2. 我需要將DOC/TXT文件大批量轉換爲PDF
- 3. 掃描.txt文件
- 4. 如何將.doc或.docx文件轉換爲.txt
- 5. 使用掃描儀掃描txt文件
- 6. 將.odt .doc .ods文件轉換爲.txt文件
- 7. 將.doc和.txt格式的文件轉換爲.aspnet的pdf文件?
- 8. 如何將txt文件轉換爲xml?
- 9. 即時將.txt文件轉換爲.pdf文件?
- 10. 使用php將pdf文件轉換爲txt文件
- 11. 將文件(.txt,.pdf ..)轉換爲流文件
- 12. 轉換爲.txt文件
- 13. 將C#中的空白.txt文件轉換爲PDF。
- 14. 如何將.docx和.pdf轉換爲.txt文件
- 15. 如何將.doc文件轉換爲.pdf文件在android
- 16. 將pdf轉換爲文本後重命名文件.txt php
- 17. 將從.doc文件複製的文本掃描爲.txt或.rtf文件拋出「java.util.NoSuchElementException:No line found」異常
- 18. 將txt或doc轉換爲pdf使用php
- 19. sum文件txt使用掃描儀java
- 20. 將doc文件轉換爲PDF
- 21. 如何把.doc或.docx文件轉換爲.pdf文件?
- 22. 將DOC文件轉換爲c#或php或.net中的DOCX
- 23. 如何將使用NTwain掃描的ImageSource轉換爲pdf文件?
- 24. pdf到txt轉換爲qt或C++
- 25. 將pdf轉換爲word doc文件
- 26. 將單個doc文件轉換爲pdf
- 27. 將pdf轉換爲txt
- 28. 如何將pdf文件轉換爲C#.net中的xml文件?
- 29. 如何將PDF文件轉換爲java swing中的doc文件?
- 30. 如何將pdf文件轉換爲android中的doc文件?
'OCR' =光學字符識別。可能的副本http://stackoverflow.com/questions/196918/open-source-ocr – MarkU 2015-02-24 06:37:46
我需要在.Net C#開源中將'掃描圖像PDF'文件轉換爲.text文件 – 2015-02-24 10:16:24