我試圖把所有使用iTextSharp的PDF文件中的文本。目前我只能得到頁面上的實際文本,不包含在用戶評論或「即時貼」如Adobe稱他們的文字。有沒有辦法做到這一點?這裏是我的代碼,到目前爲止,但我只是得到空字符串:如何使用iTextSharp從粘滯便箋中獲取文本?
PdfReader pdfRead = new PdfReader(pdfFilePath);
AcroFields form = pdfRead.AcroFields;
string txt = "";
for (int page = 1; page <= pdfRead.NumberOfPages; ++page)
{
PdfDictionary pagedic = pdfRead.GetPageN(page);
PdfArray annotarray = (PdfArray)PdfReader.GetPdfObject(pagedic.Get(PdfName.ANNOTS));
if (annotarray == null || annotarray.Size == 0)
continue;
foreach (PdfObject A in annotarray.ArrayList)
{
PdfDictionary AnnotationDictionary = (PdfDictionary)PdfReader.GetPdfObject(A);
txt += AnnotationDictionary.GetAsString(PdfName.NOTE);
txt += "\n";
}
}