我必須將PDF文件中的數據放入特定的數據庫結構中。這要求我能夠從PDF文件中獲取某些數據。由於pdf沒有任何標籤等......我想知道是否有可能獲得基於顏色的文本。舉例來說,我想要所有的紅色文本。或者我想要文檔中的所有斜體文字。這在C#中可能嗎?或者是否有其他方法可以輕鬆過濾PDF文檔中的數據?如何從pdf中獲取某種顏色的文本c#
3
A
回答
0
我採取了不同的方法。我將pdf轉換爲excel文件。這是很容易搜索彩色文本
0
通過使用這個庫http://www.codeproject.com/KB/files/xpdf_csharp.aspx?msg=3154408 你必須每一個字風格的訪問(字體,顏色...)
this.pdfDoc.Pages[4].WordList.ElementAt(143).ForeColor
0
的iText的PdfTextExtractor(以及所有它依賴於代碼)不不跟蹤當前的顏色。哎喲。這不會是所有是難以增加,所以你可以自己修改的iText:
- 添加筆觸和填充顏色成員對GraphicState類(適當地更新各種構造函數)。你可能需要爲'g','G','rg','RG','K'和'k'添加
ContentOperator
類(也可能是CS,cs,SC,sc,SCN,scn ),修改筆觸和填充顏色。 - 將方法添加到TextRenderInfo以獲取當前描邊和填充顏色。
0
嘗試PdfLibTET http://www.pdflib.com/products/tet/
它應該能夠獲得有關的文字信息。
相關問題
- 1. 如何從qplaintextedit獲取文本顏色?
- 2. 如何獲取PDF文件的文本背景顏色(RGB值)?
- 3. 如何獲取文本的顏色?
- 4. 如何獲取QLabel的文本顏色?
- 5. 獲取PDF文件中特定文本的背景顏色
- 6. 如何從C#中的硒webdriver中的顏色調色板中獲取顏色#
- 7. 從ruby-ncurses中獲取256種顏色
- 8. C#算法爲某種顏色着色
- 9. 如何從c#中的文本文件中獲取某些行?
- 10. C#:如何從某種文化中獲取資源字符串
- 11. 更改PDF文本顏色C#
- 12. 從Silverlight獲取文本顏色RichTextBox
- 13. 從範圍獲取文本顏色
- 14. 顏色的某些文本
- 15. 如何恰當地獲取文本的文本和顏色以在4種顏色之間切換/更改?
- 16. 將自動文本顏色替換爲選中的某種顯式顏色
- 17. 如何從RTF文件獲取文本大小和顏色?
- 18. 如何使用win32com從word文檔獲取顏色文本?
- 19. 如何從閃存as3獲取文本和矩形的顏色?
- 20. 如何從C#精簡框架中的顏色名稱獲取顏色?
- 21. 如何從PDF頁面獲取文本?
- 22. 如何從Rich Text Box中刪除第二種顏色的文本c#
- 23. 在PHP中獲取PDF顏色
- 24. 如何從pdf獲取pantone顏色編號?
- 25. 如何讓圖像中的某種顏色變成黑色?
- 26. 如何從文本中獲取某個字符串。 C#
- 27. 從.png文件中獲取顏色的HTML顏色代碼?
- 28. 如何從PDF中檢測顏色Python
- 29. PsychoPy中有多種顏色的文本
- 30. 同一文本中的多種顏色
您使用的是什麼PDF庫? – Oded 2011-05-03 15:43:34
iText pdf,但還沒有找到我要找的功能。所以我對任何有關圖書館的建議都是開放的 – Ojtwist 2011-05-03 15:45:00