当前位置: 首页 > news >正文

[python-opencv] PNG 裁切物体

拿到一组图PNG的图,边缘有点太宽了,需要裁切一下,为了这个需求,简单复习一下基本语法。

1.  读取PNG的4个通道

image = cv.imread(image_path, cv.IMREAD_UNCHANGED)

参数说明

IMREAD_UNCHANGED            = -1 

返回的数据带有alpha通道(R,G,B,A 四个通道),否则没有alpha通道

IMREAD_GRAYSCALE            = 0  

将图像转换为单通道灰度图像

IMREAD_COLOR                = 1  

将图像转换成3通道BGR彩色图像

IMREAD_ANYDEPTH             = 2  

在输入具有相应深度时返回16位/32位图像,否则将其转换为8位

IMREAD_ANYCOLOR             = 4  

图像可能以任何颜色格式读取

IMREAD_LOAD_GDAL            = 8 

 使用gdal驱动程序加载图像

IMREAD_REDUCED_GRAYSCALE_2  = 16

 将图像转换为单通道灰度图像且图像大小减少1/2

IMREAD_REDUCED_COLOR_2      = 17 

将图像转换为3通道BGR彩色图像且图像大小减少1/2

IMREAD_REDUCED_GRAYSCALE_4  = 32

 将图像转换为单通道灰度图像且图像大小减少1/4

IMREAD_REDUCED_COLOR_4      = 33 

将图像转换为3通道BGR彩色图像且图像大小减少1/4

IMREAD_REDUCED_GRAYSCALE_8  = 64

 将图像转换为单通道灰度图像且图像大小减少1/8

IMREAD_REDUCED_COLOR_8      = 65 

将图像转换为3通道BGR彩色图像且图像大小减少1/8

IMREAD_IGNORE_ORIENTATION   = 128

不会根据EXIF的方向标志旋转图像

2. 遍历文件夹获取每个图像文件:

def traverse_folder(folder_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)

3. 找到PNG中物体的ROI:

def findROI(img_path):image = cv.imread(img_path)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)# 获取图像的宽高通道height, width, channels = image.shape# 进行边缘检测edges = cv.Canny(gray, 50, 255)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j, i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jprint("width : ", xmax - xmin)print("height : ", ymax - ymin)return xmin,xmax,ymin,ymax

4. 遍历文件夹将jpg转PNG


def traverse_folder_convertJPGtoPNG(folder_path, output_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)# 获取没有后缀的文件名filename_without_extension = os.path.splitext(file)[0]print(filename_without_extension)#print(output_path + '/' + filename_without_extension + '.png')jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')def jpg_to_png(jpg_path, png_path):img = Image.open(jpg_path)  # 打开jpg文件img.save(png_path, 'PNG')  # 保存为png文件

5. 按照指定ROI图像获取图像区域并保存


def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)height, width, channels = image.shapeprint("图像宽度:", width)print("图像高度:", height)print("图像频道:", channels)ymin=math.floor(height*0.5-outputHeight*0.5)ymax=math.ceil(height*0.5+outputHeight*0.5)xmin=math.floor(width*0.5-outputWidth*0.5)xmax=math.ceil(width*0.5+outputWidth*0.5)cropped_image = image[ymin:ymax, xmin:xmax]# 保存为png文件cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])  

6. 按照问题所在ROI获取图像区域

def crop_and_save_image(image_path, output_path):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)height, width, channels = image.shapeedges = cv.Canny(gray, 50, 255)print(edges)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j,i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jcropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9]) 

Imwrite参数说明

IMWRITE_JPEG_QUALITY

对于JPEG,它可以是从0到100的质量(越高越好)。默认值是95。

IMWRITE_JPEG_PROGRESSIVE

启用JPEG功能,0或1,默认为False。

IMWRITE_JPEG_OPTIMIZE

启用JPEG功能,0或1,默认为False。

IMWRITE_JPEG_RST_INTERVAL

JPEG重新启动间隔,0 - 65535,默认为0 - 不重新启动。

IMWRITE_JPEG_LUMA_QUALITY

单独的亮度质量等级,0 - 100,默认为0 - 不使用。

IMWRITE_JPEG_CHROMA_QUALITY

独立的色度质量等级,0 - 100,默认为0 - 不使用。

IMWRITE_PNG_COMPRESSION

对于PNG,它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。

IMWRITE_PNG_STRATEGY

cv :: ImwritePNGFlags之一,默认为IMWRITE_PNG_STRATEGY_DEFAULT。

IMWRITE_PNG_BILEVEL

二进制级PNG,0或1,默认为0。

IMWRITE_PXM_BINARY

对于PPM,PGM或PBM,它可以是二进制格式标志,0或1.默认值为1。

IMWRITE_WEBP_QUALITY

对于WEBP,它可以是从1到100的质量(越高越好)。默认情况下(没有任何参数),质量超过100的情况下使用无损压缩。

IMWRITE_PAM_TUPLETYPE

对于PAM,将TUPLETYPE字段设置为为格式定义的相应字符串值。

IMWRITE_TIFF_RESUNIT

 对于TIFF,用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。

IMWRITE_TIFF_XDPI

对于TIFF,用于指定X方向DPI。

IMWRITE_TIFF_YDPI

对于TIFF,用于指定Y方向DPI。

IMWRITE_TIFF_COMPRESSION

 对于TIFF,用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意,对于深度为CV_32F的图像,仅使用libtiff的SGILOG压缩方案。对于其他支持的深度,可以通过此标志指定压缩方案; LZW压缩是默认值。

IMWRITE_JPEG2000_COMPRESSION_X1000

对于JPEG2000,用于指定目标压缩率(乘以1000)。该值可以是0到1000.默认值是1000

相关文章:

  • 算法学习——LeetCode力扣字符串篇
  • arcgis各种版本下载
  • 寒假作业7
  • 微服务学习 | Spring Cloud 中使用 Sentinel 实现服务限流
  • 栈的基本操作
  • 相机图像质量研究(3)图像质量测试介绍
  • [UI5 常用控件] 06.Splitter,ResponsiveSplitter
  • [职场] 服务行业个人简历 #笔记#笔记
  • 【Java EE初阶十】多线程进阶二(CAS等)
  • Linux开机自动执行自定义脚本或命令
  • ffmpeg命令生成器
  • Git合并多个commit
  • PostgreSql与Postgis安装
  • 【Spring框架】Spring事务同步
  • Ubuntu22.04 gnome-builder gnome C 应用程序习练笔记(三)
  • [译] 理解数组在 PHP 内部的实现(给PHP开发者的PHP源码-第四部分)
  • 【跃迁之路】【733天】程序员高效学习方法论探索系列(实验阶段490-2019.2.23)...
  • Akka系列(七):Actor持久化之Akka persistence
  • CSS魔法堂:Absolute Positioning就这个样
  • Go 语言编译器的 //go: 详解
  • HTML-表单
  • If…else
  • LeetCode18.四数之和 JavaScript
  • MySQL QA
  • Objective-C 中关联引用的概念
  • OSS Web直传 (文件图片)
  • python_bomb----数据类型总结
  • Python学习之路13-记分
  • Rancher-k8s加速安装文档
  • SQLServer插入数据
  • Vue实战(四)登录/注册页的实现
  • 从零开始在ubuntu上搭建node开发环境
  • 搭建gitbook 和 访问权限认证
  • 使用 Xcode 的 Target 区分开发和生产环境
  • 提醒我喝水chrome插件开发指南
  • 我看到的前端
  • 进程与线程(三)——进程/线程间通信
  • 如何正确理解,内页权重高于首页?
  • 数据库巡检项
  • ​第20课 在Android Native开发中加入新的C++类
  • # Swust 12th acm 邀请赛# [ A ] A+B problem [题解]
  • #git 撤消对文件的更改
  • #QT(串口助手-界面)
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (C语言)字符分类函数
  • (LeetCode C++)盛最多水的容器
  • (Redis使用系列) SpringBoot中Redis的RedisConfig 二
  • (第27天)Oracle 数据泵转换分区表
  • (附源码)ssm高校运动会管理系统 毕业设计 020419
  • (附源码)ssm航空客运订票系统 毕业设计 141612
  • (万字长文)Spring的核心知识尽揽其中
  • (原創) 是否该学PetShop将Model和BLL分开? (.NET) (N-Tier) (PetShop) (OO)
  • (转) RFS+AutoItLibrary测试web对话框
  • (转) 深度模型优化性能 调参
  • .apk 成为历史!