当前位置：首页 > news >正文

[python-opencv] PNG 裁切物体

news 来源：原创 2024/5/8 21:19:58

拿到一组图PNG的图，边缘有点太宽了，需要裁切一下，为了这个需求，简单复习一下基本语法。

1. 读取PNG的4个通道

image = cv.imread(image_path, cv.IMREAD_UNCHANGED)

附参数说明：

IMREAD_UNCHANGED = -1	返回的数据带有alpha通道（R,G,B,A 四个通道），否则没有alpha通道
IMREAD_GRAYSCALE = 0	将图像转换为单通道灰度图像
IMREAD_COLOR = 1	将图像转换成3通道BGR彩色图像
IMREAD_ANYDEPTH = 2	在输入具有相应深度时返回16位/32位图像，否则将其转换为8位
IMREAD_ANYCOLOR = 4	图像可能以任何颜色格式读取
IMREAD_LOAD_GDAL = 8	使用gdal驱动程序加载图像
IMREAD_REDUCED_GRAYSCALE_2 = 16	将图像转换为单通道灰度图像且图像大小减少1/2
IMREAD_REDUCED_COLOR_2 = 17	将图像转换为3通道BGR彩色图像且图像大小减少1/2
IMREAD_REDUCED_GRAYSCALE_4 = 32	将图像转换为单通道灰度图像且图像大小减少1/4
IMREAD_REDUCED_COLOR_4 = 33	将图像转换为3通道BGR彩色图像且图像大小减少1/4
IMREAD_REDUCED_GRAYSCALE_8 = 64	将图像转换为单通道灰度图像且图像大小减少1/8
IMREAD_REDUCED_COLOR_8 = 65	将图像转换为3通道BGR彩色图像且图像大小减少1/8
IMREAD_IGNORE_ORIENTATION = 128	不会根据EXIF的方向标志旋转图像

2. 遍历文件夹获取每个图像文件：

def traverse_folder(folder_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)

3. 找到PNG中物体的ROI：

def findROI(img_path):image = cv.imread(img_path)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)# 获取图像的宽高通道height, width, channels = image.shape# 进行边缘检测edges = cv.Canny(gray, 50, 255)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j, i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jprint("width : ", xmax - xmin)print("height : ", ymax - ymin)return xmin,xmax,ymin,ymax

4. 遍历文件夹将jpg转PNG


def traverse_folder_convertJPGtoPNG(folder_path, output_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)# 获取没有后缀的文件名filename_without_extension = os.path.splitext(file)[0]print(filename_without_extension)#print(output_path + '/' + filename_without_extension + '.png')jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')def jpg_to_png(jpg_path, png_path):img = Image.open(jpg_path)  # 打开jpg文件img.save(png_path, 'PNG')  # 保存为png文件

5. 按照指定ROI图像获取图像区域并保存


def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)height, width, channels = image.shapeprint("图像宽度:", width)print("图像高度:", height)print("图像频道:", channels)ymin=math.floor(height*0.5-outputHeight*0.5)ymax=math.ceil(height*0.5+outputHeight*0.5)xmin=math.floor(width*0.5-outputWidth*0.5)xmax=math.ceil(width*0.5+outputWidth*0.5)cropped_image = image[ymin:ymax, xmin:xmax]# 保存为png文件cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])

6. 按照问题所在ROI获取图像区域

def crop_and_save_image(image_path, output_path):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)height, width, channels = image.shapeedges = cv.Canny(gray, 50, 255)print(edges)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j,i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jcropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])

Imwrite参数说明

IMWRITE_JPEG_QUALITY	对于JPEG，它可以是从0到100的质量（越高越好）。默认值是95。
IMWRITE_JPEG_PROGRESSIVE	启用JPEG功能，0或1，默认为False。
IMWRITE_JPEG_OPTIMIZE	启用JPEG功能，0或1，默认为False。
IMWRITE_JPEG_RST_INTERVAL	JPEG重新启动间隔，0 - 65535，默认为0 - 不重新启动。
IMWRITE_JPEG_LUMA_QUALITY	单独的亮度质量等级，0 - 100，默认为0 - 不使用。
IMWRITE_JPEG_CHROMA_QUALITY	独立的色度质量等级，0 - 100，默认为0 - 不使用。
IMWRITE_PNG_COMPRESSION	对于PNG，它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。
IMWRITE_PNG_STRATEGY	cv :: ImwritePNGFlags之一，默认为IMWRITE_PNG_STRATEGY_DEFAULT。
IMWRITE_PNG_BILEVEL	二进制级PNG，0或1，默认为0。
IMWRITE_PXM_BINARY	对于PPM，PGM或PBM，它可以是二进制格式标志，0或1.默认值为1。
IMWRITE_WEBP_QUALITY	对于WEBP，它可以是从1到100的质量（越高越好）。默认情况下（没有任何参数），质量超过100的情况下使用无损压缩。
IMWRITE_PAM_TUPLETYPE	对于PAM，将TUPLETYPE字段设置为为格式定义的相应字符串值。
IMWRITE_TIFF_RESUNIT	对于TIFF，用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。
IMWRITE_TIFF_XDPI	对于TIFF，用于指定X方向DPI。
IMWRITE_TIFF_YDPI	对于TIFF，用于指定Y方向DPI。
IMWRITE_TIFF_COMPRESSION	对于TIFF，用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意，对于深度为CV_32F的图像，仅使用libtiff的SGILOG压缩方案。对于其他支持的深度，可以通过此标志指定压缩方案; LZW压缩是默认值。
IMWRITE_JPEG2000_COMPRESSION_X1000	对于JPEG2000，用于指定目标压缩率（乘以1000）。该值可以是0到1000.默认值是1000