【機器學習】圖片分類中增強常用方式詳解以及效果展示

圖片增強常用方式詳解

引言

圖片數據的質量和多樣性對模型的訓練效果起著至關重要的作用。然而，實際獲取的圖片數據往往存在數量不足、分布不均衡等問題。圖片增強技術應運而生，它通過對原始圖片進行一系列變換，生成更多具有多樣性的圖片，從而提升模型的泛化能力。本文將詳細介紹幾種常見的圖片增強方式及其實現方法。

隨機旋轉（Random Rotation）

在這里插入圖片描述

原理
隨機旋轉是指在一定角度范圍內對圖片進行隨機旋轉操作。這種方式可以模擬圖片在不同角度下的拍攝情況，增加模型對不同角度物體的識別能力。

** 實現 **
在 Python 中，我們可以使用 Keras 庫的 ImageDataGenerator 來實現隨機旋轉。以下是示例代碼：

from keras.preprocessing.image import ImageDataGenerator
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt# 讀取原始圖片
image_path = "your_image.jpg"
original_image = Image.open(image_path)
original_image = np.array(original_image)# 定義 ImageDataGenerator，設置旋轉范圍為 -30° 到 30°
datagen_rotation = ImageDataGenerator(rotation_range=30)# 生成旋轉后的圖片
rotated_image = datagen_rotation.flow(np.array([original_image]), batch_size=1).next()[0].astype('uint8')# 顯示原始圖片和旋轉后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(rotated_image)
axes[1].axis('off')
axes[1].set_title('旋轉后的圖片')
plt.show()

隨機平移（Random Shift）

在這里插入圖片描述

原理
隨機平移是在水平和垂直方向上對圖片進行隨機移動。通過這種方式，可以讓模型學習到物體在不同位置的特征，增強模型對物體位置變化的魯棒性。

實現
同樣使用 ImageDataGenerator 來實現隨機平移，示例代碼如下：


# 定義 ImageDataGenerator，設置水平方向平移范圍為 ±20% 寬度，垂直方向平移范圍為 ±15% 高度
datagen_shift = ImageDataGenerator(width_shift_range=0.2,height_shift_range=0.15
)# 生成平移后的圖片
shifted_image = datagen_shift.flow(np.array([original_image]), batch_size=1).next()[0].astype('uint8')# 顯示原始圖片和平移后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(shifted_image)
axes[1].axis('off')
axes[1].set_title('平移后的圖片')
plt.show()

隨機縮放（Random Zoom）

在這里插入圖片描述

原理
隨機縮放是對圖片進行隨機的放大或縮小操作。這有助于模型學習到物體在不同尺寸下的特征，提高模型對物體大小變化的適應性。

實現
使用 ImageDataGenerator 實現隨機縮放，示例代碼如下：


# 定義 ImageDataGenerator，設置縮放范圍為 0.8 - 1.2 倍
datagen_zoom = ImageDataGenerator(zoom_range=0.2)# 生成縮放后的圖片
zoomed_image = datagen_zoom.flow(np.array([original_image]), batch_size=1).next()[0].astype('uint8')# 顯示原始圖片和縮放后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(zoomed_image)
axes[1].axis('off')
axes[1].set_title('縮放后的圖片')
plt.show()

隨機翻轉（Random Flip）

在這里插入圖片描述

原理
隨機翻轉包括水平翻轉和垂直翻轉。通過對圖片進行翻轉操作，可以增加數據的多樣性，讓模型學習到物體在不同鏡像狀態下的特征。

實現
使用 ImageDataGenerator 實現隨機翻轉，示例代碼如下：


# 定義 ImageDataGenerator，僅啟用水平翻轉
datagen_flip = ImageDataGenerator(horizontal_flip=True)# 生成翻轉后的圖片
flipped_image = datagen_flip.flow(np.array([original_image]), batch_size=1).next()[0].astype('uint8')# 顯示原始圖片和翻轉后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(flipped_image)
axes[1].axis('off')
axes[1].set_title('翻轉后的圖片')
plt.show()

隨機剪切（Random Shear）

在這里插入圖片描述

原理
隨機剪切是對圖片進行一定角度的傾斜操作，模擬物體在不同視角下的變形情況，增強模型對物體形變的識別能力。

實現
使用 ImageDataGenerator 實現隨機剪切，示例代碼如下：


# 定義 ImageDataGenerator，設置剪切范圍為 0 - 0.3 弧度
datagen_shear = ImageDataGenerator(shear_range=0.3)# 生成剪切后的圖片
sheared_image = datagen_shear.flow(np.array([original_image]), batch_size=1).next()[0].astype('uint8')# 顯示原始圖片和剪切后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(sheared_image)
axes[1].axis('off')
axes[1].set_title('剪切后的圖片')
plt.show()

亮度調整（Brightness Adjustment）

在這里插入圖片描述

原理
亮度調整是對圖片的亮度進行隨機調整，模擬不同光照條件下的拍攝情況，提高模型對光照變化的魯棒性。

實現
使用 ImageDataGenerator 實現亮度調整，示例代碼如下：


# 定義 ImageDataGenerator，設置亮度調整范圍為 0.5 - 1.5 倍
datagen_brightness = ImageDataGenerator(brightness_range=[0.5, 1.5])# 生成亮度調整后的圖片
brightened_image = datagen_brightness.flow(np.array([original_image]), batch_size=1).next()[0].astype('uint8')# 顯示原始圖片和亮度調整后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(brightened_image)
axes[1].axis('off')
axes[1].set_title('亮度調整后的圖片')
plt.show()

對比度調整（Contrast Adjustment）

在這里插入圖片描述

原理
對比度調整是改變圖片中不同像素之間的差異程度，增強圖片的視覺效果，讓模型能夠學習到更豐富的圖像特征。

實現
使用 OpenCV 庫實現對比度調整，示例代碼如下：


import cv2
import numpy as npdef adjust_contrast(img):# 轉換為灰度圖（如需保留彩色可調整）img_gray = cv2.cvtColor(img.astype('uint8'), cv2.COLOR_RGB2GRAY)# 對比度拉伸min_val = np.min(img_gray)max_val = np.max(img_gray)stretched = (img - min_val) * (255.0 / (max_val - min_val + 1e-8))return stretched.astype('float32')# 應用自定義對比度調整
contrasted_image = adjust_contrast(original_image).astype('uint8')# 顯示原始圖片和對比度調整后的圖片
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(original_image)
axes[0].axis('off')
axes[0].set_title('原始圖片')axes[1].imshow(contrasted_image)
axes[1].axis('off')
axes[1].set_title('對比度調整后的圖片')
plt.show()

總結

圖片增強是計算機視覺任務中非常重要的一環，通過上述幾種常見的圖片增強方式，可以有效地擴充數據集，提高模型的泛化能力。在實際應用中，可以根據具體任務和數據特點選擇合適的增強方式，也可以將多種增強方式組合使用，以獲得更好的效果。希望本文能幫助你更好地理解和應用圖片增強技術。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/89402.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/89402.shtml
英文地址，請注明出處：http://en.pswp.cn/web/89402.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！