当前位置: 首页 > news >正文

目标检测-数据集

目标检测数据集是用于训练、验证和测试目标检测模型的图像和标注数据的集合。这些数据集通常包含多种类别的物体,并提供了每个物体的位置信息(即边界框)。下面是一些广泛使用的目标检测数据集,以及它们的特点:

1. COCO (Common Objects in Context)

  • 网址: COCO Dataset
  • 特点: COCO 是一个通用的目标检测、分割和关键点检测数据集,包含 80 个类别的日常物体(如人、车、动物、家具等)。它的标注包括边界框和分割掩码(instance segmentation)。
  • 数据量: 约 330,000 张图像,其中约 200,000 张图像标注了 150 万个物体实例。
  • 应用: 常用于目标检测、分割、关键点检测等任务。

2. Pascal VOC

  • 网址: Pascal VOC Dataset
  • 特点: VOC 是经典的目标检测数据集之一,包含 20 个物体类别。数据集的标注以边界框为主,并包括图像分类和语义分割任务。
  • 数据量: 从 VOC 2007 到 VOC 2012 版本,包含约 11,000 张图像和 27,000 个标注实例。
  • 应用: 主要用于目标检测和语义分割。

3. Open Images Dataset

  • 网址: Open Images Dataset
  • 特点: 包含数百万张图像和数十亿个物体实例标注,涵盖了 600 多个类别。除了边界框标注,还包括关系、属性标注。
  • 数据量: 900 万张图像,600 多类物体标注,超过 3500 万个边界框实例。
  • 应用: 主要用于目标检测、场景理解等任务。

4. ImageNet Object Detection (ILSVRC)

  • 网址: ImageNet
  • 特点: ImageNet 的 ILSVRC 挑战部分包含了 200 个类别的目标检测数据集。该数据集主要用于分类任务,但也有一部分用于目标检测。
  • 数据量: 50 万张训练图像,带有边界框标注。
  • 应用: 主要用于大规模目标检测和分类任务。

5. KITTI Dataset

  • 网址: KITTI Dataset
  • 特点: KITTI 是一个专注于自动驾驶领域的目标检测数据集,提供了城市环境下的车辆、行人、骑车人等的标注数据。数据采集通过安装在车辆上的多传感器平台完成,包含 LiDAR 和 RGB 图像。
  • 数据量: 约 15,000 张图像,带有 2D 和 3D 边界框标注。
  • 应用: 主要用于自动驾驶中的目标检测、3D 目标检测和跟踪等任务。

6. Berkley DeepDrive (BDD100K)

  • 网址: BDD100K
  • 特点: BDD100K 是一个大规模的自动驾驶相关的数据集,涵盖了城市、乡村和高速公路场景中的物体。数据集中包含 2D 目标检测、语义分割、实例分割、驾驶行为分类等任务。
  • 数据量: 100,000 张图像,带有多种标注类型。
  • 应用: 主要用于自动驾驶中的目标检测和场景理解。

7. DOTA (Dataset for Object Detection in Aerial Images)

  • 网址: DOTA Dataset
  • 特点: DOTA 是一个专门用于遥感图像中的目标检测数据集。它包含了从卫星和无人机拍摄的高分辨率图像,并且标注了旋转边界框,以适应不同的目标方向。
  • 数据量: 约 2,800 张高分辨率图像,包含 15 个类别,超过 18 万个目标实例。
  • 应用: 主要用于遥感图像中的目标检测。

8. VisDrone

  • 网址: VisDrone
  • 特点: VisDrone 数据集聚焦于无人机航拍图像中的目标检测任务,场景主要包括城市、乡村、交通等多样化的环境。
  • 数据量: 超过 10,000 张图像,含有 8 类物体(如行人、车辆等)。
  • 应用: 主要用于无人机图像中的目标检测和跟踪。

这些数据集可以根据你研究的需求进行选择,例如如果你是研究通用场景的目标检测,COCO 和 Pascal VOC 是很好的选择;如果你在做自动驾驶相关的研究,KITTI 或 BDD100K 是更适合的数据集。如果你对遥感图像感兴趣,可以选择 DOTA 或 VisDrone。

你正在开发或训练的目标检测模型可以使用这些数据集进行微调和测试。

相关文章:

  • Win11家庭版找不到gpedit.msc文件怎么办
  • Apache APISIX学习(1):介绍、docker启动
  • docker - 迁移和备份
  • DasViewer浏览器中的格式转换,与网格大师的转换有什么区别?
  • 如何将 Apifox 的自动化测试与 Jenkins 集成?
  • iOS开发工程师面试
  • 使用 Llama 3.1 和 Qdrant 构建多语言医疗保健聊天机器人的步骤
  • 【Hadoop】一、Hadoop入门:基础配置、集群配置、常用脚本
  • 爬虫逆向学习(九):记录一个集cookie、请求参数、请求体、响应文本加密的站点反爬
  • Cpp内存管理(7)
  • 海信智能电视的使用心得
  • Elasticsearch 启动后在浏览器输入http://localhost:9200 访问失败
  • 企微SOP:构建标准化运营流程,驱动企业高效增长
  • 【JavaEE初阶】深入解析死锁的产生和避免以及内存不可见问题
  • PHP 函数
  • ➹使用webpack配置多页面应用(MPA)
  •  D - 粉碎叛乱F - 其他起义
  • Dubbo 整合 Pinpoint 做分布式服务请求跟踪
  • extract-text-webpack-plugin用法
  • fetch 从初识到应用
  • github指令
  • go append函数以及写入
  • Java 11 发布计划来了,已确定 3个 新特性!!
  • Javascript编码规范
  • Java面向对象及其三大特征
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • Python十分钟制作属于你自己的个性logo
  • React Native移动开发实战-3-实现页面间的数据传递
  • SegmentFault 2015 Top Rank
  • SegmentFault 技术周刊 Vol.27 - Git 学习宝典:程序员走江湖必备
  • TypeScript实现数据结构(一)栈,队列,链表
  • vue从入门到进阶:计算属性computed与侦听器watch(三)
  • 高度不固定时垂直居中
  • 机器学习中为什么要做归一化normalization
  • 快速构建spring-cloud+sleuth+rabbit+ zipkin+es+kibana+grafana日志跟踪平台
  • 目录与文件属性:编写ls
  • 使用前端开发工具包WijmoJS - 创建自定义DropDownTree控件(包含源代码)
  • 我这样减少了26.5M Java内存!
  • 走向全栈之MongoDB的使用
  • 2017年360最后一道编程题
  • 教程:使用iPhone相机和openCV来完成3D重建(第一部分) ...
  • ​​​【收录 Hello 算法】10.4 哈希优化策略
  • # centos7下FFmpeg环境部署记录
  • #java学习笔记(面向对象)----(未完结)
  • (~_~)
  • (二)测试工具
  • (附源码)ssm高校运动会管理系统 毕业设计 020419
  • (附源码)计算机毕业设计ssm-Java网名推荐系统
  • (六)c52学习之旅-独立按键
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理 第13章 项目资源管理(七)
  • (一)插入排序
  • (转) RFS+AutoItLibrary测试web对话框
  • (转)C语言家族扩展收藏 (转)C语言家族扩展
  • (转)JAVA中的堆栈
  • ****Linux下Mysql的安装和配置