当前位置: 首页 > news >正文

[iBOT] Image BERT Pre-Training with Online Tokenizer

1、目的

        探索visual tokenizer编码下的MIM(Masked Image Modeling)

2、方法

        iBOT(image BERT pre-training with Online Tokenizer)

        1)knowledge distillation(KD)

                distill knowledge from the tokenizer

        2)self-distillation

                twin teacher as online tokenizer

        3)visual tokenizer

                -> transform the masked patches to supervisory signals for the target model

                -> 通过enforce the similarity of cross-view images on class tokens,来捕获到high-level visual semantics 

                -> 无须额外的训练,通过momentum update来和MIM一同被优化

                -> online,而不是pre-fixed

        4)网络结构

                -> 

                -> 用softmax之后的token,而非ont-hot

        5)multi-crop

        6)MIM

                                        ​​​​​​​        

3、结论

        1)iBOT is more scalable to larger models

        2)iBOT requires more data to train larger model

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • springboot高校实验室预约系统-计算机毕业设计源码58031
  • 无需温度修正,测值准确可靠 GEO ACxxxx型振弦式锚索测力计
  • 机器学习特征分析
  • macos安装ArgoCD
  • Docker 学习 Day 1
  • 鸿蒙开发(API 12 Beta6版)【通用属性协议】 网络篇
  • 十分钟学会Kubernetes(K8S) 部署SpringBoot3.0
  • Java语言程序设计基础篇_编程练习题**17.20 (二进制编辑器)
  • 系统编程-多路IO复用
  • NLP自然语言处理学习过程中知识点总结
  • CSS具有哪些特点呢?
  • 滚雪球学Java(88):连接无限,资源有度:JavaSE数据库连接池深度解析,有两下子!
  • 顶级出图效果!免费在线使用FLux.1 模型,5s出图无限制!
  • 三十四、模型绑定与验证
  • 客户端负载均衡Ribbon 小实例
  • 《深入 React 技术栈》
  • 【笔记】你不知道的JS读书笔记——Promise
  • 2017 前端面试准备 - 收藏集 - 掘金
  • Android 初级面试者拾遗(前台界面篇)之 Activity 和 Fragment
  • css选择器
  • javascript面向对象之创建对象
  • Java超时控制的实现
  • Java教程_软件开发基础
  • js操作时间(持续更新)
  • spring boot 整合mybatis 无法输出sql的问题
  • SpringBoot几种定时任务的实现方式
  • tensorflow学习笔记3——MNIST应用篇
  • Vue2.x学习三:事件处理生命周期钩子
  • vue-router的history模式发布配置
  • vuex 学习笔记 01
  • 从零搭建Koa2 Server
  • 分享一份非常强势的Android面试题
  • 解析 Webpack中import、require、按需加载的执行过程
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 爬虫进阶 -- 神级程序员:让你的爬虫就像人类的用户行为!
  • 前端性能优化--懒加载和预加载
  • 入职第二天:使用koa搭建node server是种怎样的体验
  • 微信小程序设置上一页数据
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • 移动互联网+智能运营体系搭建=你家有金矿啊!
  • elasticsearch-head插件安装
  • 国内唯一,阿里云入选全球区块链云服务报告,领先AWS、Google ...
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • ​html.parser --- 简单的 HTML 和 XHTML 解析器​
  • ​你们这样子,耽误我的工作进度怎么办?
  • #我与Java虚拟机的故事#连载08:书读百遍其义自见
  • (16)Reactor的测试——响应式Spring的道法术器
  • (MTK)java文件添加简单接口并配置相应的SELinux avc 权限笔记2
  • (ZT)北大教授朱青生给学生的一封信:大学,更是一个科学的保证
  • (带教程)商业版SEO关键词按天计费系统:关键词排名优化、代理服务、手机自适应及搭建教程
  • (翻译)Quartz官方教程——第一课:Quartz入门
  • (剑指Offer)面试题34:丑数
  • (贪心) LeetCode 45. 跳跃游戏 II
  • (转载)OpenStack Hacker养成指南
  • (转载)微软数据挖掘算法:Microsoft 时序算法(5)