当前位置：首页 > news >正文

Python OpenCV精讲系列 - 计算机视觉应用深入理解（十五）

news 来源：原创 2024/9/28 12:42:35

在这里插入图片描述

💖💖⚡️⚡️专栏：Python OpenCV精讲⚡️⚡️💖💖
本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进阶的开发者，都将在此收获满满的知识与实践经验。

引言

OpenCV（Open Source Computer Vision Library）是一款开源的计算机视觉库，被广泛应用于图像处理和计算机视觉的各种任务中。OpenCV不仅提供了丰富的API来处理图像和视频流，还支持多种高级计算机视觉技术，如目标检测、人脸识别、三维重建等。本文将详细介绍OpenCV在计算机视觉中的应用，并探讨其在不同领域的具体实现。

计算机视觉基础

计算机视觉是一门研究如何使计算机“看”的科学。它主要涉及图像处理、模式识别和机器学习等多个学科。OpenCV作为一款强大的工具库，支持广泛的计算机视觉应用，包括但不限于：

图像处理：如图像增强、滤波、边缘检测等。
目标检测：如物体识别、人脸检测等。
三维重建：从多幅图像中恢复三维场景。
视频分析：如运动检测、目标跟踪等。

图像处理

图像处理是计算机视觉中最基础的部分，它涉及对图像进行预处理和特征提取，为后续的高级应用奠定基础。

图像滤波

滤波是图像处理中的一个重要步骤，它可以去除图像中的噪声、平滑图像或突出某些特征。

import cv2
import numpy as np# 读取图像
image = cv2.imread('image.jpg')# 应用高斯模糊
blurred = cv2.GaussianBlur(image, (5, 5), 0)# 显示结果
cv2.imshow('Blurred Image', blurred)
cv2.waitKey(0)
cv2.destroyAllWindows()

边缘检测

边缘检测用于提取图像中的边缘信息，是图像分割和特征提取的重要步骤。

# Canny边缘检测
edges = cv2.Canny(image, 100, 200)# 显示结果
cv2.imshow('Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

目标检测

目标检测是指从图像中识别出特定的物体，并定位其位置。OpenCV支持多种目标检测方法。

Haar特征级联分类器

Haar特征级联分类器是一种快速的目标检测方法，常用于人脸检测。

# 加载级联分类器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# 读取图像
image = cv2.imread('image.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 检测人脸
faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))# 绘制矩形框
for (x, y, w, h) in faces:cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)# 显示结果
cv2.imshow('Face Detection', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

深度学习方法

OpenCV可以集成预训练的深度学习模型来执行更复杂的任务，如物体识别。

# 加载模型
model_path = 'path/to/model.pb'
config_path = 'path/to/config.pbtxt'net = cv2.dnn.readNetFromTensorflow(model_path, config_path)# 加载图像
image = cv2.imread('image.jpg')
blob = cv2.dnn.blobFromImage(image, size=(300, 300), swapRB=True, crop=False)# 进行预测
net.setInput(blob)
detections = net.forward()# 处理输出
for detection in detections[0, 0]:confidence = detection[2]if confidence > 0.5:# 获取边界框坐标box = detection[3:7] * np.array([image.shape[1], image.shape[0], image.shape[1], image.shape[0]])(startX, startY, endX, endY) = box.astype("int")# 在图像上绘制边界框cv2.rectangle(image, (startX, startY), (endX, endY), (0, 255, 0), 2)# 显示结果
cv2.imshow('Object Detection', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

三维重建

三维重建是指从多幅图像中恢复出三维场景的过程。OpenCV提供了工具来完成这一任务。

特征检测与匹配

特征检测与匹配是三维重建的关键步骤之一。

# 特征检测与匹配
orb = cv2.ORB_create()# 找到关键点和描述子
kp1, des1 = orb.detectAndCompute(image1, None)
kp2, des2 = orb.detectAndCompute(image2, None)# 匹配特征点
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
matches = bf.match(des1, des2)# 排序匹配项
matches = sorted(matches, key=lambda x:x.distance)# 绘制匹配
img_matches = cv2.drawMatches(image1, kp1, image2, kp2, matches[:10], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)
cv2.imshow('Feature Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

三角测量

三角测量是从两幅或多幅图像中恢复三维点云的过程。

# 三角测量
points4D = cv2.triangulatePoints(mtx @ np.hstack((np.eye(3), np.zeros((3,1)))), mtx @ np.hstack((R, t)), kp1.T, kp2.T)
points3D = cv2.convertPointsFromHomogeneous(points4D.T)# 将点云保存为PLY文件
ply_header = '''ply
format ascii 1.0
element vertex {}
property float x
property float y
property float z
end_header
'''def write_ply(fn, verts):verts = verts.reshape(-1, 3)with open(fn, 'w') as f:f.write(ply_header.format(len(verts)))np.savetxt(f, verts, '%f %f %f')write_ply('output.ply', points3D)

在这里插入图片描述

视频分析

视频分析涉及从视频流中提取有用的信息，如运动检测、目标跟踪等。

运动检测

运动检测用于识别视频帧之间的变化区域。

# 帧差法
prev_frame = Nonewhile cap.isOpened():ret, frame = cap.read()if not ret:breakgray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)gray = cv2.GaussianBlur(gray, (21, 21), 0)if prev_frame is None:prev_frame = graycontinue# 计算帧差frame_delta = cv2.absdiff(prev_frame, gray)thresh = cv2.threshold(frame_delta, 25, 255, cv2.THRESH_BINARY)[1]# 膨胀阈值图像填充孔洞thresh = cv2.dilate(thresh, None, iterations=2)# 显示结果cv2.imshow('frame', thresh)k = cv2.waitKey(30) & 0xffif k == 27:breakprev_frame = graycap.release()
cv2.destroyAllWindows()

目标跟踪

目标跟踪是指在视频序列中连续追踪一个或多个物体。

# 卡尔曼滤波器
kalman = cv2.KalmanFilter(4, 2)
kalman.measurementMatrix = np.array([[1, 0, 0, 0], [0, 1, 0, 0]], np.float32)
kalman.transitionMatrix = np.array([[1, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]], np.float32)
kalman.processNoiseCov = np.array([[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0, 0, 1]], np.float32) * 0.03# 初始化状态向量
state = np.array([0, 0, 0, 0], np.float32)while cap.isOpened():ret, frame = cap.read()if not ret:break# 检测物体位置# 假设已经得到物体的位置position = np.array([x, y], np.float32)# 预测下一时刻的状态prediction = kalman.predict()# 更新卡尔曼滤波器kalman.correct(position)# 显示结果cv2.circle(frame, (int(prediction[0]), int(prediction[1])), 5, (0, 0, 255), -1)cv2.imshow('frame', frame)k = cv2.waitKey(30) & 0xffif k == 27:breakcap.release()
cv2.destroyAllWindows()