2013-12-14 64 views
1

我正在處理一組用於處理Microsoft Office Open XML文檔的庫。在Word和PowerPoint文檔中嵌入圖片的過程中,我需要確定圖片的MIME類型以及像素尺寸等一些標題詳細信息,dpi也不錯。如何確定Python中常見圖像類型的類型和大小?

目前我正在使用Pillow來做到這一點,但作爲依賴關係去不理想。我只對庫使用了幾條語句,但依賴性要求人們安裝C編譯器和libjpeg等圖像庫。這使得安裝在Windows上特別具有挑戰性,儘管在OS X上它比我想要的更多。

有沒有一種方法可以讓我獲得純粹的Python圖像庫的基礎知識,或者也許只是將合理簡單的模塊與我的發行版合併?

+0

如果擴展模塊的分佈是問題,則可以創建包含預構建二進制文件的輪子。 – delnan

+0

pypi上有可用於枕頭的窗口二進制文件:https://pypi.python.org/pypi/Pillow/2.2.1 – ThiefMaster

回答

3

首先,使用枕頭可能是最好的解決方案,特別是因爲你可以download windows binaries from pypi

快速谷歌搜索得到this pure-python function得到GIF,PNG和JPEG圖像的大小:

import struct 
from cStringIO import StringIO 


def get_image_info(data): 
    """ 
    Return (content_type, width, height) for a given img file content 
    no requirements 
    """ 
    data = str(data) 
    size = len(data) 
    height = -1 
    width = -1 
    content_type = '' 

    # handle GIFs 
    if (size >= 10) and data[:6] in ('GIF87a', 'GIF89a'): 
     # Check to see if content_type is correct 
     content_type = 'image/gif' 
     w, h = struct.unpack("<HH", data[6:10]) 
     width = int(w) 
     height = int(h) 

    # See PNG 2. Edition spec (http://www.w3.org/TR/PNG/) 
    # Bytes 0-7 are below, 4-byte chunk length, then 'IHDR' 
    # and finally the 4-byte width, height 
    elif ((size >= 24) and data.startswith('\211PNG\r\n\032\n') 
      and (data[12:16] == 'IHDR')): 
     content_type = 'image/png' 
     w, h = struct.unpack(">LL", data[16:24]) 
     width = int(w) 
     height = int(h) 

    # Maybe this is for an older PNG version. 
    elif (size >= 16) and data.startswith('\211PNG\r\n\032\n'): 
     # Check to see if we have the right content type 
     content_type = 'image/png' 
     w, h = struct.unpack(">LL", data[8:16]) 
     width = int(w) 
     height = int(h) 

    # handle JPEGs 
    elif (size >= 2) and data.startswith('\377\330'): 
     content_type = 'image/jpeg' 
     jpeg = StringIO(data) 
     jpeg.read(2) 
     b = jpeg.read(1) 
     try: 
      while (b and ord(b) != 0xDA): 
       while (ord(b) != 0xFF): b = jpeg.read 
       while (ord(b) == 0xFF): b = jpeg.read(1) 
       if (ord(b) >= 0xC0 and ord(b) <= 0xC3): 
        jpeg.read(3) 
        h, w = struct.unpack(">HH", jpeg.read(4)) 
        break 
       else: 
        jpeg.read(int(struct.unpack(">H", jpeg.read(2))[0])-2) 
       b = jpeg.read(1) 
      width = int(w) 
      height = int(h) 
     except struct.error: 
      pass 
     except ValueError: 
      pass 

    return content_type, width, height 

注意,對博客的代碼被寫了靈光VAÏSSE。他的博客上沒有指定許可證,因此取決於您想要包含代碼的位置可能想要重新實現該功能或要求他在安全網站上。

+0

甜!這是非常令人鼓舞的,只是在包裝中實施我所需要的東西可能是非常可行的,謝謝!我將對此進行研究,以瞭解他在做什麼,並進行一些搜索以查找有關標題的更多信息。 – scanny