Python 提供了 PIL(python image library)圖像庫,來滿足開發者處理圖像的功能,該庫提供了廣泛的文件格式支持,包括常見的 JPEG、PNG、GIF 等,它提供了圖像創建、圖像顯示、圖像處理等功能。
基本概念
要學習 PIL 圖像庫的使用,我們必須先來了解一些關于圖像的基本概念,包括深度(depth),通道(bands),模式(mode),坐標系統(coordinate system)等。
圖像的深度
圖像中像素點占得 bit 位數,就是圖像的深度,比如:
二值圖像:圖像的像素點不是0就是1 (圖像不是黑色就是白色),圖像像素點占的位數就是1位,圖像的深度就是1,也稱作位圖。
灰度圖像:圖像的像素點位于0-255之間(0代表全黑,255代表全白,在0-255之間插入了255個等級的灰度)。2^8=255,圖像像素點占的位數就是8位,圖像的深度是8。
依次類推,我們把計算機中存儲單個像素點所用的 bit 位稱為圖像的深度。
圖像的通道
每張圖像都是有一個或者多個數據通道構成的,如 RGB 是基本的三原色(紅色、綠色和藍色),如果我們用8位代表一種顏色,那么每種顏色的最大值是255,這樣,每個像素點的顏色值范圍就是(0-255, 0-255, 0-255)。這樣的圖像的通道就是3。而灰度圖像的通道數是1。
圖像的模式
圖像實際上是像素數據的矩形圖,圖像的模式定義了圖像中像素的類型和深度,每種類型代表不同的深度,在 PIL 中我們稱之為圖像的模式。常見的模式有以下幾種:
1:1位像素,表示黑和白,占8 bit ,在圖像表示中稱為位圖。
L:表示黑白之間的灰度,占8 bit 像素。
P:8位像素,使用調色版映射。
RGB:真彩色,占用 3x8 位像素,其中 R 為紅色,G 為綠色,B為藍色,三原色疊加形成的色彩變化,如三通道都為0則代表黑色,都為255則代表白色。
RGBA:為帶透明蒙版的真彩色,其中的 A 為 alpha 透明度,占用 4x8 位像素
其他的還有 CMYK、 YCbCr、I、F等不常用的模式,這里就不多做介紹了。
圖像的坐標系
PIL 中圖像的坐標是從左上角開始,向右下角延伸,以二元組 (x,y)的形式傳遞,x 軸從左到右,y 軸從上到下,即左上角的坐標為 (0, 0)。那么矩形用四元組表示就行,例如一個450 x 450 像素的矩形圖像可以表示為 (0, 0, 450, 450)。
PIL 的安裝
和其他庫一樣,PIL 的安裝也很簡單:
pip3 install pillow
PIL 圖像模塊的功能
打開圖像
我們可以從本地目錄中打開文件,也可以從文件流中打開圖像。打開文件的方法為:
Image.open(file,mode)
讀取圖像文件,mode 只能是 ‘r’,所以我們也可以省略這個參數。
from PIL import Image
from io import BytesIO
import requests
# 打開圖像文件
im = Image.open('cat.jpg')
# 從文件流中打開圖像
r = requests.get('http://f.hiphotos.baidu.com/image/pic/item/b151f8198618367aa7f3cc7424738bd4b31ce525.jpg')
im2 = Image.open(BytesIO(r.content))
# 展示圖像
im.show()
im2.show()
# 翻轉90度展示
im.rotate(90).show()
我們首先打開本目錄下的 cat.jpg 圖像,接著從百度圖片請求到一張圖片,使用文件流的方式打開。使用 show 方法可以展示圖像。我們也可以使用 rotate 方法來是圖像翻轉角度。運行程序,我們會看到彈出三張圖片,一張是 cat.jpg 對應的圖像,一張是百度圖片中的圖像,還有一種是將 cat.jpg 翻轉90度后展示的圖像。
創建圖像
Image.new(mode,size,color)
我們可以使用給定的模式、大小和顏色來創建新圖像。大小以(寬度,高度)的二元組形式給出,單位為像素;顏色以單波段圖像的單個值和多波段圖像的元組(每個波段的一個值)給出,可以使用顏色名如 ‘red’ ,也可以受用16進制 '#FF0000' 或者使用數字表示(255,0,0)。
from PIL import Image
im = Image.new('RGB', (450, 450), (255, 0, 0))
im1 = Image.new('RGB', (450, 450), 'red')
im2 = Image.new('RGB', (450, 450), '#FF0000')
im.show()
im1.show()
im2.show()
上面例子中我們分別通過三種形式創建了 RGB 模式的大小為 450x450 ,顏色為紅色的圖像,最終的圖像效果是一樣的。
轉換格式
Image.save(file)
我們直接使用保存方法,修改保存的文件名就可以轉換圖像的格式。
from PIL import Image
# 加載 cat.jpg
im = Image.open('cat.jpg', 'r')
# 打印圖片類型
print(im.format)
# 保存為 png 類型圖片
im.save('cat.png')
# 加載新保存的 png 類型圖片
im2 = Image.open('cat.png', 'r')
# 打印新保存圖片類型
print(im2.format)
# 輸出結果
JPEG
PNG
例子中我們先打開 cat.jpg 圖像,然后新保存一張類型為 png 的圖像,通過打印我們可以看到兩者的格式。
創建縮略圖
Image.thumbnail(size, resample=3)
修改當前圖像制作成縮略圖,該縮略圖尺寸不大于給定的尺寸。這個方法會計算一個合適的縮略圖尺寸,使其符合當前圖像的寬高比,調用方法 draft() 配置文件讀取器,最后改變圖像的尺寸。
size 參數表示給定的最終縮略圖大小。
resample 參數是過濾器,只能是 NEAREST、BILINEAR、BICUBIC 或者 ANTIALIAS 之一。如果省略該變量,則默認為 NEAREST。
注意:在當前PIL的版本中,濾波器 BILINEAR 和 BICUBIC 不能很好地適應縮略圖產生。用戶應該使 用ANTIALIAS,圖像質量最好。如果處理速度比圖像質量更重要,可以選用其他濾波器。這個方法在原圖上進行修改。
from PIL import Image
# 加載圖像
im = Image.open('cat.png')
# 展示圖像
im.show()
# 圖像尺寸
size = 128, 128
# 縮放圖像
im.thumbnail(size, Image.ANTIALIAS)
# 展示圖像
im.show()
我們將一個 450x450 大小的圖像縮放成了 128x128 大小的圖像,程序運行的結果如下圖:
融合圖像
Image.blend(image1, image2, alpha)
將圖像 image1 和 圖像 im2 根據 alpha 值進行融合,公式為:
out = image1 * (1.0 - alpha) + image2 * alpha
image1 和 image2 表示兩個大小和模式相同的圖像, alpha 是介于 0 和 1 之間的值。如果 alpha 為0,返回 image1 圖像,如果 alpha 為1,返回 image2 圖像。
from PIL import Image
# 藍色圖像
image1 = Image.new('RGB', (128, 128), (0, 0, 255))
# 紅色圖像
image2=Image.new('RGB', (128, 128), (255, 0, 0))
# 取中間值
im = Image.blend(image1, image2, 0.5)
image1.show()
image2.show()
# 顯示紫色圖像
im.show()
我們將一張藍色圖像和一張紅色圖像進行融合,融合度為兩張圖像各0.5,最終得到一張紫色圖像(因為紅色疊加藍色會調和成紫色)。顯示圖像如下圖:
像素點處理
Image.eval(image, *args)
根據傳入的函數對圖像每個像素點進行處理。第一個參數 image 為需要處理的圖像對象,第二個參數是函數對象,有一個整數作為參數。
如果變量image所代表圖像有多個通道,那么函數作用于每一個通道。注意:函數對每個像素點只處理一次,所以不能使用隨機組件和其他生成器。
from PIL import Image
im = Image.open('cat.jpg')
im.show()
# 將每個像素值翻倍(相當于亮度翻倍)
evl1 = Image.eval(im, lambda x: x*2)
evl1.show()
# 將每個像素值減半(相當于亮度減半)
evl2 = Image.eval(im, lambda x: x/2)
evl2.show()
我們分別對圖像進行像素值翻倍和減半處理,顯示效果如下圖:
合成圖像
Image.composite(image1, image2, mask)
使用給定的兩張圖像及 mask 圖像作為透明度,創建出一張新的圖像。變量 mask 圖像的模式可以為“1”,“L” 或者 “RGBA”。所有圖像必須有相同的尺寸。
from PIL import Image
# 打開 cat.png
image1 = Image.open('cat.png')
# 打開 flower.jpg
image2 = Image.open('flower.jpg')
# 分離image1的通道
r, g, b = image1.split()
# 合成圖像,獲得 cat + flower
im = Image.composite(image1, image2, mask=b)
image1.show()
image2.show()
im.show()
上面例子中我們將一張圖像貓(cat.png)和一張圖像花(flower.jpg),以圖像貓的一個通道構成的蒙版進行合成,就像 PS 一樣,我們最終得到貓+花的圖像,結果如下圖所示:
通過單通道創建圖像
Image.merge(mode,bands)
將一組單通道圖像合并成多通道圖像。參數 mode 為輸出圖像的模式,bands 為輸出圖像中每個通道的序列。
from PIL import Image
im = Image.open('cat.png')
# 將三個通道分開
im_split = im.split()
# 分別顯示三個單通道圖像
im_split[0].show()
im_split[1].show()
im_split[2].show()
# 將三個通道再次合并
im2 = Image.merge('RGB', im_split)
im2.show()
# 打開第二張圖像
im3 = Image.open('flower.jpg')
# 將第二張圖像的三個通道分開
im_split2 = im3.split()
# 將第二張圖像的第1個通道和第一張圖像的第2、3通道合成一張圖像
rgbs = [im_split2[0], im_split[1], im_split[2]]
im4 = Image.merge('RGB', rgbs)
im4.show()
上面例子中,我們先將 cat.jpg 圖像的三個通道分離成三張圖像,效果如下圖:
然后我們又將 flower.jpg 圖像的三個通道分離,最后分別取 flower.jpg 的 R 通道圖像和 cat.jpg 的 G 和 B 通道圖像合成一張新圖像,最終的效果如下圖:
總結
本節為大家介紹了 Python pillow 庫中圖像有關的幾個基本概念,以及 PIL 模塊中處理圖像的幾個常見功能。掌握了這些功能后,我們可以打開、創建圖像,也可以對圖像做一些常見的如拆分、合成、融合等操作,這些都是圖像處理的基礎,需要大家好好理解和掌握。