当前位置: 首页 > news >正文

小红书-社区搜索部 (NLP、CV算法实习生) 一面面经

😄 整个流程按如下问题展开,用时60min左右面试官人挺好,前半部分问问题,后半部分coding一道题。

各位有什么问题可以直接评论区留言,24小时内必回信息,放心~

文章目录

  • 1、自我介绍
  • 2、介绍下项目:微信-多模态小视频分类
    • 2.1、看你用了cross-att来融合多模态信息,cross-att是怎么做的?
    • 2.2、如何处理文本,ocr,asr输入模型?
  • 3、resnet和vit区别在哪?
  • 4、swin-trm相比vit做了什么改进?
  • 5、有无对ocr,asr里的噪音进行处理?
  • 6、有无关注类别里的长尾问题?如何处理的?
  • 7、focal-loss原理?
  • 8、trm里的位置编码和bert里的位置编码的区别?
  • 9、介绍下项目:京东-商品标题实体识别?
  • 10、标题中实体堆叠紧密,实体前后未必有强烈的上下文语义信息,怎么针对性解决?采用的模型结构有针对这方面吗?
  • 11、对新词,也就是训练集里没出现过的词,有处理吗?
  • 12、有无考虑采用匹配类的方法,用词库来做实体匹配?效果会不会更好呢?知识注入类的NER方法有无了解?
  • 13、coding部分:无重复字符的最长子串
  • 14、互问阶段

1、自我介绍

2、介绍下项目:微信-多模态小视频分类

2.1、看你用了cross-att来融合多模态信息,cross-att是怎么做的?

2.2、如何处理文本,ocr,asr输入模型?

3、resnet和vit区别在哪?

4、swin-trm相比vit做了什么改进?

5、有无对ocr,asr里的噪音进行处理?

6、有无关注类别里的长尾问题?如何处理的?

7、focal-loss原理?

8、trm里的位置编码和bert里的位置编码的区别?

9、介绍下项目:京东-商品标题实体识别?

10、标题中实体堆叠紧密,实体前后未必有强烈的上下文语义信息,怎么针对性解决?采用的模型结构有针对这方面吗?

11、对新词,也就是训练集里没出现过的词,有处理吗?

12、有无考虑采用匹配类的方法,用词库来做实体匹配?效果会不会更好呢?知识注入类的NER方法有无了解?

13、coding部分:无重复字符的最长子串

在这里插入图片描述
滑动窗口+哈希表解决:

class Solution:def lengthOfLongestSubstring(self, s: str) -> int:# 滑动窗口:记录无重复字符的最长子串win_dict = dict() # 记录滑动窗口最左端left = 0 max_len = 0for i in range(len(s)):if s[i] in win_dict.keys():if win_dict[s[i]] >= left:left = win_dict[s[i]] + 1 # 更新左边界win_dict[s[i]] = imax_len = max(max_len, i-left+1)return max_len       

14、互问阶段

  • 相互了解下情况。

相关文章:

  • 宝藏网站推荐-封面图片生成器
  • 芯课堂 | UI Creator 物理键盘移植指南
  • element ui 的密码输入框点击显示隐藏密码时,图标随之改变
  • Mysql之基本架构
  • 信息系统项目管理师--八大绩效域-不确定性绩效域
  • 1701java药品进销存管理系统Myeclipse开发sqlserver数据库web结构java编程计算机网页项目
  • Docker简单使用
  • React中显示数据
  • 大数据学习之安装并配置maven环境
  • 领域知识 | 智能驾驶安全领域部分常见概论
  • 深入分析 Android Activity (三)
  • 如何用正则表达式匹配中文和英文
  • 树洞陪聊系统源码/陪聊/陪玩/树洞/陪陪/公众号开发/源码交付/树洞系统源码
  • 初步学习pygame,使用pygame搭建简单的窗口效果
  • ArrayList与LinkedList
  • 网络传输文件的问题
  • [分享]iOS开发-关于在xcode中引用文件夹右边出现问号的解决办法
  • 【跃迁之路】【735天】程序员高效学习方法论探索系列(实验阶段492-2019.2.25)...
  • angular2 简述
  • Consul Config 使用Git做版本控制的实现
  • hadoop入门学习教程--DKHadoop完整安装步骤
  • Java编程基础24——递归练习
  • java取消线程实例
  • windows-nginx-https-本地配置
  • Yeoman_Bower_Grunt
  • 后端_MYSQL
  • 计算机在识别图像时“看到”了什么?
  • 七牛云 DV OV EV SSL 证书上线,限时折扣低至 6.75 折!
  • 让你成为前端,后端或全栈开发程序员的进阶指南,一门学到老的技术
  • 通过git安装npm私有模块
  • 小而合理的前端理论:rscss和rsjs
  • 延迟脚本的方式
  • 在GitHub多个账号上使用不同的SSH的配置方法
  • 仓管云——企业云erp功能有哪些?
  • ​ ​Redis(五)主从复制:主从模式介绍、配置、拓扑(一主一从结构、一主多从结构、树形主从结构)、原理(复制过程、​​​​​​​数据同步psync)、总结
  • !!【OpenCV学习】计算两幅图像的重叠区域
  • # AI产品经理的自我修养:既懂用户,更懂技术!
  • #{}和${}的区别?
  • #nginx配置案例
  • (06)Hive——正则表达式
  • (附源码)计算机毕业设计ssm-Java网名推荐系统
  • (回溯) LeetCode 77. 组合
  • (七)glDrawArry绘制
  • (一) storm的集群安装与配置
  • (杂交版)植物大战僵尸
  • (转)从零实现3D图像引擎:(8)参数化直线与3D平面函数库
  • ***测试-HTTP方法
  • ***通过什么方式***网吧
  • ./和../以及/和~之间的区别
  • .babyk勒索病毒解析:恶意更新如何威胁您的数据安全
  • .net 8 发布了,试下微软最近强推的MAUI
  • .net mvc actionresult 返回字符串_.NET架构师知识普及
  • .Net Winform开发笔记(一)
  • .NET 事件模型教程(二)
  • .NET/C# 将一个命令行参数字符串转换为命令行参数数组 args