我已經使用itextsharp提取了PDF,然後將其轉換爲html,以便比較兩個PDF的格式。在這個我添加左和頂部位置的文字對齊。但只要我收到上標文字改變的位置。但是,當我檢查螢火蟲時,左右位置的位置與我使用Adobe Illustrator檢查的位置相同。任何人都可以聯繫我。爲什麼會發生這種情況。在我發佈的例子中,7位數字應該低於「was」,但是它遠離「was」 el。比較和提取文本時的位置
Vector curBaseline = renderInfo.GetBaseline().GetStartPoint();
Vector topRight = renderInfo.GetAscentLine().GetEndPoint();
y_direction_source = Form1.Pagesize_source +(height_extract_source_page - curBaseline[Vector.I2]);
this.result.AppendFormat("<p style=\"left:{0}pt;top:{1}pt;\">" curBaseline[Vector.I1], y_direction_source);
結果:
<p style="font-family:TimesNewRoman;font-size:12.2618001271429pt;font-weight:;font-style:;left:42pt;top:120.2399pt;position:absolute;">
<p style="background: cyan">training</p>
<p style="background: cyan">camps</p>
<pp style="background: cyan">in</p>
<pp style="background: cyan">Afghanistan</p>
<pp style="background: cyan">.</p>
</p>
<pp style="font-family:TimesNewRoman;font-size:10.2386067682737pt;font-weight:;font-style:;left:441.48pt;top:114.72pt;position:absolute;">
<pp style="background: cyan">7</p>
</p>
請發佈相關代碼和PDF以使您的問題具有可重現性。 – mkl 2013-05-07 11:43:04
你用什麼代碼來提取文本? 「was」和「7」的像素位置是什麼?什麼是輸出HTML和CSS? – 2013-05-07 11:45:46
7的位置是441.48pt,y位置是114.72pt – pdp 2013-05-07 11:59:10