2011-06-03 31 views
1

我想生成PDF文件或將使用Tj運算符的現有PDF文件轉換爲用Tl表示文本引用的字符串,並且它不應包含TJ運算符和TD運算符。我必須在acrobat蒸餾器服務器6.0.1或Adobe Illustrator的設置中設置。在這個問題上幫助我。僅用Tj運算符生成PDF

目前我正在使用這些操作符來識別和搜索文本,並將它們作爲字典存儲用於我的目的。

回答

0

我不認爲Distiller支持任何類型的東西。

我建議你找一個更好的方法來提取你的文本。即使您的所有文本都使用Tj而不是其他文本顯示運算符(不僅僅是TJ),但如果遇到自定義編碼,您仍然遇到麻煩。讓已經解決了這個問題的其他人爲你做。

有很多程序可以做一個相當不錯的從PDF提取文本。最好的還是Acrobat/Reader ...所以如果你無法從Reader中選擇/複製/粘貼文本,那麼其他軟件將無法工作...保存OCR(O potical C haracter R ecognition)。

我偏向於iText(Java)和iTextSharp(C#)...我是一個提交者。無論如何,還有其他很多其他應用程序在做基本相同的事情......坐在免費軟件/免費軟件/商業頻譜的各個地方。哎呀,iTexts坐在這個頻譜的幾個地方。 :rolleyes: