0
我遇到問題,無法從PDF文件中提取突出顯示的文本。 str變量總是空的。任何人都可以幫助我?如何使用itextsharp庫僅複製pdf中的高亮文本?
我的代碼:
private static string GetPdfHighlighText(string file, int page) {
string nv = "";
PdfReader reader = new PdfReader(file);
for (int x = 1; x < reader.NumberOfPages; x++)
{
PdfDictionary pageDict = reader.GetPageN(x);
PdfArray annots = pageDict.GetAsArray(PdfName.ANNOTS);
if (annots != null)
{
for (int i = 1; i <= annots.Size; ++i)
{
PdfDictionary annotationDic = (PdfDictionary)PdfReader.GetPdfObject(annots[i]);
PdfName subType = (PdfName)annotationDic.Get(PdfName.SUBTYPE);
if (subType.Equals(PdfName.HIGHLIGHT))
{
PdfString str = annots.GetAsString(i);
nv = nv + str;
}
}
}
}
return nv; }
我使用iTextSharp的庫。 PFLibrary是iTextSharp.text.pdf命名空間。
我想要掃描pdf中的所有頁面並提取所有突出顯示的文本, 這是245頁,但我將每頁放置過濾器。我可以找出亮點的註釋但是未返回與文本字符串突出