xpdf

    1熱度

    1回答

    我想將PDF頁面的背景圖像提取到SVG(使用xpdf庫)。我面臨的問題是,PDF包含額外的圖像/圖形(大概,作物箱),而不是由PDF閱讀器呈現,但相應的SVG包含這些圖像/圖形。我嘗試將SVG的viewBox屬性設置爲對應於該PDF頁面的邊界的cropBox,但生成的SVG仍顯示一些未由PDF呈現的圖形對象。我還嘗試向SVG添加一個剪輯路徑 - 一個矩形剪輯區域(界限對應於PDF裁剪框),但這也不

    1熱度

    1回答

    我想在一個文件夾中運行批處理轉換,其中包含完整的pdf文件。我已經使用xpdf的,這是單個文件的命令提示符: C:\測試\ pdftotext -layout firstpdftoconvert.pdf firstpdfconverted.txt 可能有人幫助,請做一次過(將所有隻有pdf文件)使用批處理文件?提前致謝!

    1熱度

    1回答

    一直在挖掘歲月,並努力尋找答案。 有我們的OSX開發系統的單個二進制pdftotext 0.39版本(安裝在使用brew install poppler,我們找不到其他版本brew search poppler只有一個單一的一個。我們正試圖找到這個特定版本的源代碼(編譯Linux上)。由於某種原因,我們只有一個特定的PDF文件(但不是更新版本)。(嘗試其他的東西,如Ghostscript pdft

    1熱度

    1回答

    下正確地處理我的pdftotext舊Linux版本(0.12.4),如果沒有問題,運行,但我想在Windows 7計算機上運行它。 我下載了Windows安裝程序,看起來是最新版本,xpdf-2.03-bin.exe從http://gnuwin32.sourceforge.net/packages/xpdf.htm。 我接受所有的安裝程序默認值。當我運行Windows 7 pdftotext對Li

    0熱度

    1回答

    我的工作進展得順利的時候,但我遇到由於一些含有怪異的符號我的PDF文件的問題(「DY「§」) 我審查了更早的討論,但沒有這些解決方案的工作: R tm package invalid input in 'utf8towcs' 這是到目前爲止我的代碼: setwd("E:/OneDrive/Thesis/Received comments document/Consultation 50") ge

    1熱度

    1回答

    我最近設置了一個Linux服務器,可以使用作爲Xpdf一部分的pdftotext命令將基於文本的PDF轉換爲文本,並通過使用gs( Ghostscript)和tesseract命令。 當我已經知道PDF是基於文本還是基於圖像的時候,兩種解決方案都能很好地工作。但是,爲了自動化將許多PDF轉換爲文本的過程,我需要能夠判斷PDF是基於文本還是基於圖像,以便我知道在PDF上運行哪一組進程。 有沒有什麼辦

    1熱度

    1回答

    有沒有人有示範代碼演示如何使用XPDF庫從PDF中提取矢量圖形對象(如那些代表圖表和流程圖)?似乎在Web上沒有任何文檔可用於xpdf庫,也不能找到任何使用該庫從PDF中提取信息的示例代碼。我正在瀏覽xpdf的代碼庫,但是任何指向它的文檔或示例代碼的指針都會非常有幫助。

    1熱度

    1回答

    我想提取600個用文本格式填充的pdf文件,所以我可以做一些數據探索。看起來像pdftool是我完成工作的最佳選擇,但幫助文件很簡短。我找到的最接近的教程使用xpdf。有沒有辦法使用pdftools來做到這一點? library("pdftools") folder <- file.path("C:\\Users\\adarvishian\\Documents\\MEGA\\Consular

    2熱度

    1回答

    我正在嘗試用Awesome做一些魔術,通常我會缺少Xpdf pid。當我有任何其他窗口正在測試時,client.pid字段是確定的,幷包含窗口的pid。然而用Xpdf這個字段總是設置爲0. 有沒有什麼方法可以在Awesome中獲得Xpdf的windows pid,所以我可以在客戶端列表中找到這個窗口?

    0熱度

    1回答

    我正在使用調用xpdf引擎的簡單批處理文件將PDF轉換爲TXT文件。現在,生成的txt文件的名稱與PDF相同,除了擴展名已被更改爲.txt。但是,我想在原始文件名後面添加一些文本,我該怎麼做?例如,如果有一個名爲test.pdf的PDF文件,它應該被轉換爲文本並存儲在名爲testFULL.txt的txt文件中。 這是當前的批處理文件,我有: for /R %%s in (*.pdf) do "C: