当前位置: 首页 > news >正文

[SimCLR v2] Big Self-Supervised Models are Strong Semi-Supervised Learners

1、目的

        借助无监督预训练来提升半监督学习的效果

2、方法

        

        1)unsupervised/self-supervised pretrain

                -> task-agnostic

                -> big (deep and wide) neural network可以有效提升准确性

                -> improvements upon SimCLR

                        larger ResNet models;deeper but less wide

                        deeper(3-layer) non-linear network(projection head)

                        incorporate the memory mechanism from MoCo

        2)supervised fine-tuning

                fine-tune from the first layer of the MLP head

        3)self-training / knowledge distillation using unlabeled data

                -> no real labels are used

                        

                        

                -> 当labeled example数据量较大时,可以结合进loss计算中

                        

                -> encourage the student network to mimic the teacher network's label predictions

                -> fix teacher network, train (smaller) student network

                -> 大模型先self-distillation,再向小模型做knowledge distillation

3、结论

        1)半监督学习的可用label越少,越能从大模型中获益

        2)用于具体任务时,大模型不是必要的,因此可以transfer到小模型上

        3)用一个较深的projection head,可以提升半监督的结果

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【C语言】结构体新的理解
  • Day05-Unity Time类
  • element el-popover组件 查看示例图片功能实现
  • 【记录】基于Windows系统安装rust环境的过程
  • [报错] nvcc -V 找不到
  • vue3中批量下载文件(压缩包)功能
  • Linux学习之路 -- systemV进程通信 -- 消息队列和信号量(简单介绍)
  • ssrf实现
  • springboot+vue+mybatis计算机毕业设计电子产品交易系统+PPT+论文+讲解+售后
  • iview checkbox单独使用时 如何去掉显示的true和false以及不显示文字
  • VBA技术资料MF180:将某个文件夹中的某类图片导入Word
  • sqlite blob 数据检索(基于sqlite3_get_table的优化)
  • 如何使用Gitee管理自己的项目
  • 【自由能系列(初级)】自由能原理——神经科学的“能量守恒”方程
  • 惠海H6900B升压恒流调光IC芯片3.7V7.4V12V升压18V24V36V 48V 植物灯/电解水
  • 【面试系列】之二:关于js原型
  • 2017年终总结、随想
  • Angular数据绑定机制
  • CSS相对定位
  • ES6, React, Redux, Webpack写的一个爬 GitHub 的网页
  • JavaScript的使用你知道几种?(上)
  • js学习笔记
  • node 版本过低
  • python学习笔记 - ThreadLocal
  • session共享问题解决方案
  • VuePress 静态网站生成
  • 道格拉斯-普克 抽稀算法 附javascript实现
  • 复习Javascript专题(四):js中的深浅拷贝
  • 时间复杂度与空间复杂度分析
  • 验证码识别技术——15分钟带你突破各种复杂不定长验证码
  • 赢得Docker挑战最佳实践
  • 怎么把视频里的音乐提取出来
  • 主流的CSS水平和垂直居中技术大全
  • 函数计算新功能-----支持C#函数
  • 如何用纯 CSS 创作一个菱形 loader 动画
  • # Redis 入门到精通(八)-- 服务器配置-redis.conf配置与高级数据类型
  • #Datawhale X 李宏毅苹果书 AI夏令营#3.13.2局部极小值与鞍点批量和动量
  • #数学建模# 线性规划问题的Matlab求解
  • ()、[]、{}、(())、[[]]命令替换
  • (¥1011)-(一千零一拾一元整)输出
  • (Arcgis)Python编程批量将HDF5文件转换为TIFF格式并应用地理转换和投影信息
  • (MonoGame从入门到放弃-1) MonoGame环境搭建
  • (不用互三)AI绘画工具应该如何选择
  • (二)Pytorch快速搭建神经网络模型实现气温预测回归(代码+详细注解)
  • (附源码)计算机毕业设计ssm基于Internet快递柜管理系统
  • (个人笔记质量不佳)SQL 左连接、右连接、内连接的区别
  • (四)stm32之通信协议
  • (五)c52学习之旅-静态数码管
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (译)计算距离、方位和更多经纬度之间的点
  • (转)setTimeout 和 setInterval 的区别
  • (转)Unity3DUnity3D在android下调试
  • (转)程序员疫苗:代码注入
  • (转)创业的注意事项
  • (转)人的集合论——移山之道