我不確定這是否可行,但我試圖以自動方式從pdf生成許多縮略圖,然後將它們存儲在elasticsearch中。基本上我想將pdf轉換爲一系列jpgs(或pngs,或類似的東西),然後將它們作爲二進制文件索引。目前我生產這些jpgs是這樣的:在主腳本中捕獲子進程中產生的jpgs
import subprocess
params = ['convert', 'pdf_file', 'thumb.jpg']
subprocess.check_call(params)
它工作的很好,但它只是將jpgs寫入文件系統。我希望將這些文件作爲字符串,而不必將它們寫出到本地文件系統。我已經嘗試過使用子過程的stdout方法,但我對使用子過程相當陌生,所以我無法弄清楚這一點。
我正在使用imagemagick進行此轉換,但只要能實現此目標,我就可以切換到任何其他工具。 任何想法?
如你在蟒蛇的工作,它會是一個好主意,使用Python和不是通過調用外部程序做,叉子往往是昂貴的。 – zmo
@zmo分叉可能很昂貴,但我用很大的pdf做了幾次,所以我想通過python綁定獲得的收益是值得的。我也不相信這個子過程實際上是分叉的。 –
@SlaterTyranus:''subprocess'絕對分叉(除非你在Windows上,在這種情況下它改爲'CreateProcess')。它還能如何工作? – abarnert