我期待在以下網址: http://www.unisonagency.com/assets/news/unison_pr_mvsl.pdf奇怪的PDF文本提取情況
所有的開源文本提取工具我試過了,給我的標題如下:
uNISON LAuNCHeS MAGHReb VIRTuAL SCIeNCe LIbRARy: A NeW
PORTAL PROMOTING INTeRNATIONAL SCIeNTIFIC AND
TeCHNICAL COLLAbORATION
然而,Adobe Acrobat Reader給出了一些更合理的東西 -
Unison Launch es Maghr eb Virt ual Sci enc e
Librar y: A New Portal Promoting Int ernational
Scientific and Technical Colla boration
空格關閉,但字符外殼更有意義。任何想法爲何存在差異?