2013-08-06 16 views
4

我需要從任意文件類型獲取縮略圖。 (或儘可能多的。)獲取任意文件類型的縮略圖

對於像文件類型的圖像,我可以使用image-magick。對於文件類似的文件,我想我會用:

文檔 - >(與Pyuno開放辦公室)PDF - >(Image-magick)PDF到圖像。 - >第一頁的縮略圖。

  1. 有沒有更好的方法來做到這一點?
  2. 有沒有可以做到這一點的網絡服務?

回答

1

是的,我想你說得對。當然有一些網絡服務,雖然我沒有使用這些的經驗,所以我不會在這裏列出。

創建文檔的縮略圖需要渲染,像docx這樣的辦公文檔非常複雜,只有極少數庫或應用程序可以渲染它們。 LibreOffice似乎是該領域最好的選擇。

幸運的是,已經有一個Python腳本,它提供了一個使用LibreOffice/OpenOffice轉換的命令行前端:unoconv。它應該能夠使用辦公套件中的所有導出過濾器(包括png和pdf)。

我注意到一些問題直接導出到PNG,但PDF出口大多數罰款。

順便說一句:如果你有imagemagick的問題,你可能想嘗試ghostscript。