当前位置: 首页 > news >正文

V3Det大规模词汇视觉检测数据集与LaRS海上全景障碍物检测数据集

V3Det与LaRS是ICCV2023上发表的数据集工作,规模都比较大,后续有可能会用到,因此记录下来。

V3Det: Vast Vocabulary Visual Detection Dataset

Paper: https://arxiv.org/abs/2304.03752

URL: https://v3det.openxlab.org.cn/

在现实世界中检测任意对象的最新进展是在词汇相对有限的对象检测数据集上进行训练和评估的。为了便于开发更通用的视觉对象检测,我们提出了V3Det,这是一个庞大的词汇视觉检测数据集,在海量图像上具有精确注释的边界框。V3Det具有几个吸引人的特性:1)丰富的词汇:它包含来自真实世界图像上13204个类别的对象的边界框,比现有的大词汇对象检测数据集(例如LVIS)大10倍。2) 层次类别组织:V3Det的庞大词汇由一个层次类别树组织,该树注释了类别之间的包含关系,鼓励在庞大和开放的词汇对象检测中探索类别关系。3) 丰富的注释:V3Det包含243k张图像中的精确注释对象,以及由人类专家和强大的聊天机器人编写的每个类别的专业描述。通过提供广阔的探索空间,V3Det能够在大量和开放词汇的对象检测方面实现广泛的基准测试,为未来的研究带来新的观察、实践和见解。它有潜力成为开发更通用视觉感知系统的基石数据集。

LaRS: A Diverse Panoptic Maritime Obstacle Detection Dataset and Benchmark

Paper: https://arxiv.org/abs/2308.09618

URL: https://lojzezust.github.io/lars-dataset/

由于缺乏能够充分捕捉一般海洋环境复杂性的多样化数据集,阻碍了海洋障碍物检测的进展。我们展示了第一个海上全景障碍物探测基准LaRS,以湖泊、河流和海洋为特色。我们的主要贡献是新的数据集,它在记录位置、场景类型、障碍物类别和采集条件方面拥有相关数据集中最大的多样性。LaRS由4000多个每像素标记的关键帧和9个前帧组成,以允许利用时间纹理,总计超过40k帧。每个关键帧都用11个事物类和19个全局场景属性进行注释。我们报告了27种语义和全景分割方法的结果,以及一些性能见解和未来的研究方向。

相关文章:

  • HTTP协议及Requests库方法
  • 多线程---阻塞队列+生产者消费者模型
  • 软考高项-基础知识
  • Linux学习第26天:异步通知驱动开发: 主动
  • 框架安全-CVE 复现SpringStrutsLaravelThinkPHP漏洞复现
  • vue中electron与vue通信(fs.existsSync is not a function解决方案)
  • C++ 中的仿函数 functor
  • PHP | php入门知识(if、switch、数组、数组排序、超级全局变量)
  • 6G关键新兴技术- 智能超表面(RIS)技术演进
  • DbVisualizer和DBeaver启动不来,启动报错
  • nodejs+vue食力派网上订餐系统-计算机毕业设计
  • AVL树、红黑树的介绍和实现[C++]
  • Windows 和 Linux 这2个系统在进行编程实现的时候的一些区别:
  • Flutter FittedBox
  • 【Python入门教程】基于OpenCV视频分解成图片+图片组合成视频(视频抽帧组帧)
  • 【162天】黑马程序员27天视频学习笔记【Day02-上】
  • 2017-09-12 前端日报
  • CODING 缺陷管理功能正式开始公测
  • gf框架之分页模块(五) - 自定义分页
  • hadoop集群管理系统搭建规划说明
  • java B2B2C 源码多租户电子商城系统-Kafka基本使用介绍
  • JAVA之继承和多态
  • maven工程打包jar以及java jar命令的classpath使用
  • mongodb--安装和初步使用教程
  • nfs客户端进程变D,延伸linux的lock
  • node-glob通配符
  • Promise面试题2实现异步串行执行
  • React Native移动开发实战-3-实现页面间的数据传递
  • Spring声明式事务管理之一:五大属性分析
  • SQL 难点解决:记录的引用
  • 半理解系列--Promise的进化史
  • 从tcpdump抓包看TCP/IP协议
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 回流、重绘及其优化
  • 前端技术周刊 2018-12-10:前端自动化测试
  • 世界编程语言排行榜2008年06月(ActionScript 挺进20强)
  • 通过git安装npm私有模块
  • 转载:[译] 内容加速黑科技趣谈
  • const的用法,特别是用在函数前面与后面的区别
  • 阿里云服务器如何修改远程端口?
  • ​总结MySQL 的一些知识点:MySQL 选择数据库​
  • ###C语言程序设计-----C语言学习(6)#
  • #我与Java虚拟机的故事#连载06:收获颇多的经典之作
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (笔记)Kotlin——Android封装ViewBinding之二 优化
  • (非本人原创)史记·柴静列传(r4笔记第65天)
  • (附源码)ssm高校社团管理系统 毕业设计 234162
  • (汇总)os模块以及shutil模块对文件的操作
  • (论文阅读23/100)Hierarchical Convolutional Features for Visual Tracking
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (原)记一次CentOS7 磁盘空间大小异常的解决过程
  • (转)Linux NTP配置详解 (Network Time Protocol)
  • (转)linux自定义开机启动服务和chkconfig使用方法
  • .NET 8.0 中有哪些新的变化?
  • .Net 垃圾回收机制原理(二)